Tags
ACL 2024 2
ACL 2025 1
Action Model 1
Agents 1
Alignment 1
Blog 1
CodeRep 3
COLM 2024 1
Data Synthesis 1
DPO 1
Evaluation 2
Foundation Model 1
Graph 1
GUI Agent 3
Hallucination 1
ICLR 2025 1
IEEE TKDE 1
Instruction Tuning 1
Interpretability 1
Knowledge Graph 2
LLM 3
misc 1
Multi-Agent 2
Multimodal 1
Multimodality 1
Optimization 1
OS Agent 1
Peer Review 1
Preference Optimization 1
Prompt 1
PTMs 3
Reasoning 3
research 1
TeX 3
Text-to-Image 1
Transformer 1
ACL 2024
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
ACL 2025
- 2025-05-15 OS-Genesis:自动构造 GUI Agent 所需的训练数据 (ACL 2025)
Action Model
- 2025-02-25 OS-Atlas:面向通用 GUI Agent 的基础动作模型
Agents
- 2024-11-25 ChatGen:自动化文生图系统
Alignment
- 2024-11-05 LD-DPO:基于 DPO 的长度脱敏偏好优化算法
Blog
- 2022-07-17 快速为 Hexo-Icarus 配置 MathJax(2022)
CodeRep
- 2022-07-09 Code预训练语言模型学习指南(原理/分析/代码)Part2
- 2022-07-06 Code预训练语言模型学习指南(原理/分析/代码)Part1
- 2022-06-12 A Structural Analysis of CodePTMs
COLM 2024
- 2025-01-15 Corex:通过多模型协作增强推理能力 (COLM 2024)
Data Synthesis
- 2025-05-15 OS-Genesis:自动构造 GUI Agent 所需的训练数据 (ACL 2025)
DPO
- 2024-11-05 LD-DPO:基于 DPO 的长度脱敏偏好优化算法
Evaluation
- 2025-03-20 大型语言模型真的擅长逻辑推理吗?(IEEE TKDE)
- 2024-07-30 SEA:基于大模型的自动评审框架
Foundation Model
- 2025-02-25 OS-Atlas:面向通用 GUI Agent 的基础动作模型
Graph
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
GUI Agent
- 2025-05-15 OS-Genesis:自动构造 GUI Agent 所需的训练数据 (ACL 2025)
- 2025-02-25 OS-Atlas:面向通用 GUI Agent 的基础动作模型
- 2025-02-15 AgentStore:迈向通专融合的自动化计算机助手
Hallucination
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
ICLR 2025
- 2025-02-20 OCEAN:离线多步推理评估与对齐 (ICLR 2025)
IEEE TKDE
- 2025-03-20 大型语言模型真的擅长逻辑推理吗?(IEEE TKDE)
Instruction Tuning
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
Interpretability
- 2022-06-12 A Structural Analysis of CodePTMs
Knowledge Graph
- 2025-02-20 OCEAN:离线多步推理评估与对齐 (ICLR 2025)
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
LLM
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
- 2024-07-30 SEA:基于大模型的自动评审框架
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
misc
- 2022-08-23 [2022] 配置一台用于开发的MacBook
Multi-Agent
- 2025-02-15 AgentStore:迈向通专融合的自动化计算机助手
- 2025-01-15 Corex:通过多模型协作增强推理能力 (COLM 2024)
Multimodal
- 2024-11-25 ChatGen:自动化文生图系统
Multimodality
- 2022-08-11 ViLT:图像-文本多模态Transformer
Optimization
- 2022-09-09 黑箱优化:语言模型即服务
OS Agent
- 2025-02-15 AgentStore:迈向通专融合的自动化计算机助手
Peer Review
- 2024-07-30 SEA:基于大模型的自动评审框架
Preference Optimization
- 2024-11-05 LD-DPO:基于 DPO 的长度脱敏偏好优化算法
Prompt
- 2022-09-09 黑箱优化:语言模型即服务
PTMs
- 2022-07-09 Code预训练语言模型学习指南(原理/分析/代码)Part2
- 2022-07-06 Code预训练语言模型学习指南(原理/分析/代码)Part1
- 2022-06-12 A Structural Analysis of CodePTMs
Reasoning
- 2025-03-20 大型语言模型真的擅长逻辑推理吗?(IEEE TKDE)
- 2025-02-20 OCEAN:离线多步推理评估与对齐 (ICLR 2025)
- 2025-01-15 Corex:通过多模型协作增强推理能力 (COLM 2024)
research
- 2022-02-06 The Value of Research & Novelty in Science
TeX
- 2022-03-28 华东师大本科毕业设计模版(Class of 2022)
- 2022-03-22 配置LaTeX Beamer的小技巧
- 2022-03-19 (Xe)LaTeX小技巧
Text-to-Image
- 2024-11-25 ChatGen:自动化文生图系统
Transformer
- 2022-08-11 ViLT:图像-文本多模态Transformer