Categories
Alignment 1
Blog 1
CodeRep 3
Computer-Using Agents 3
Graph 1
LLM 9
misc 1
Multimodal 1
Multimodality 1
NLP 3
Prompt Learning 1
Reasoning 4
research 1
Research Methodology 1
TeX 3
Alignment
- 2024-11-05 LD-DPO:基于 DPO 的长度脱敏偏好优化算法
Blog
- 2022-07-17 快速为 Hexo-Icarus 配置 MathJax(2022)
CodeRep
- 2022-07-09 Code预训练语言模型学习指南(原理/分析/代码)Part2
- 2022-07-06 Code预训练语言模型学习指南(原理/分析/代码)Part1
- 2022-06-12 A Structural Analysis of CodePTMs
Computer-Using Agents
- 2025-05-15 OS-Genesis:自动构造 GUI Agent 所需的训练数据 (ACL 2025)
- 2025-02-25 OS-Atlas:面向通用 GUI Agent 的基础动作模型
- 2025-02-15 AgentStore:迈向通专融合的自动化计算机助手
Graph
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
LLM
- 2025-03-20 大型语言模型真的擅长逻辑推理吗?(IEEE TKDE)
- 2025-02-20 OCEAN:离线多步推理评估与对齐 (ICLR 2025)
- 2025-02-15 AgentStore:迈向通专融合的自动化计算机助手
- 2025-01-15 Corex:通过多模型协作增强推理能力 (COLM 2024)
- 2024-11-25 ChatGen:自动化文生图系统
- 2024-11-05 LD-DPO:基于 DPO 的长度脱敏偏好优化算法
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
- 2024-07-30 SEA:基于大模型的自动评审框架
- 2024-07-15 InstructGraph:以图为中心的大模型指令微调与偏好对齐 (ACL 2024)
misc
- 2022-08-23 [2022] 配置一台用于开发的MacBook
Multimodal
- 2024-11-25 ChatGen:自动化文生图系统
Multimodality
- 2022-08-11 ViLT:图像-文本多模态Transformer
NLP
- 2022-07-09 Code预训练语言模型学习指南(原理/分析/代码)Part2
- 2022-07-06 Code预训练语言模型学习指南(原理/分析/代码)Part1
- 2022-06-12 A Structural Analysis of CodePTMs
Prompt Learning
- 2022-09-09 黑箱优化:语言模型即服务
Reasoning
- 2025-03-20 大型语言模型真的擅长逻辑推理吗?(IEEE TKDE)
- 2025-02-20 OCEAN:离线多步推理评估与对齐 (ICLR 2025)
- 2025-01-15 Corex:通过多模型协作增强推理能力 (COLM 2024)
- 2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
research
- 2022-02-06 The Value of Research & Novelty in Science
Research Methodology
- 2024-07-30 SEA:基于大模型的自动评审框架
TeX
- 2022-03-28 华东师大本科毕业设计模版(Class of 2022)
- 2022-03-22 配置LaTeX Beamer的小技巧
- 2022-03-19 (Xe)LaTeX小技巧