Categories - Qiushi Sun

Qiushi Sun

Ph.D. candidate in NLP

Alignment

2024-11-05 LD-DPO：基于 DPO 的长度脱敏偏好优化算法

Blog

2022-07-17 快速为 Hexo-Icarus 配置 MathJax（2022）

CodeRep

2022-07-09 Code预训练语言模型学习指南（原理/分析/代码）Part2
2022-07-06 Code预训练语言模型学习指南（原理/分析/代码）Part1
2022-06-12 A Structural Analysis of CodePTMs

Computer-Using Agents

2025-05-15 OS-Genesis：自动构造 GUI Agent 所需的训练数据 (ACL 2025)
2025-02-25 OS-Atlas：面向通用 GUI Agent 的基础动作模型
2025-02-15 AgentStore：迈向通专融合的自动化计算机助手

Graph

2024-07-15 InstructGraph：以图为中心的大模型指令微调与偏好对齐 (ACL 2024)

LLM

2025-03-20 大型语言模型真的擅长逻辑推理吗？(IEEE TKDE)
2025-02-20 OCEAN：离线多步推理评估与对齐 (ICLR 2025)
2025-02-15 AgentStore：迈向通专融合的自动化计算机助手
2025-01-15 Corex：通过多模型协作增强推理能力 (COLM 2024)
2024-11-25 ChatGen：自动化文生图系统
2024-11-05 LD-DPO：基于 DPO 的长度脱敏偏好优化算法
2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)
2024-07-30 SEA：基于大模型的自动评审框架
2024-07-15 InstructGraph：以图为中心的大模型指令微调与偏好对齐 (ACL 2024)

misc

2022-08-23 [2022] 配置一台用于开发的MacBook

Multimodal

2024-11-25 ChatGen：自动化文生图系统

Multimodality

2022-08-11 ViLT：图像-文本多模态Transformer

NLP

2022-07-09 Code预训练语言模型学习指南（原理/分析/代码）Part2
2022-07-06 Code预训练语言模型学习指南（原理/分析/代码）Part1
2022-06-12 A Structural Analysis of CodePTMs

Prompt Learning

2022-09-09 黑箱优化：语言模型即服务

Reasoning

2025-03-20 大型语言模型真的擅长逻辑推理吗？(IEEE TKDE)
2025-02-20 OCEAN：离线多步推理评估与对齐 (ICLR 2025)
2025-01-15 Corex：通过多模型协作增强推理能力 (COLM 2024)
2024-08-15 知识链 = 知识图谱 + 大模型 + 推理 − 幻觉 (ACL 2024)

research

2022-02-06 The Value of Research & Novelty in Science

Research Methodology

2024-07-30 SEA：基于大模型的自动评审框架

TeX