雪泥工坊

Back

About

这个博客不是为了把自己包装得很厉害。它更像一个持续更新的工作台:记录我怎么学习、怎么踩坑、怎么把一个想法慢慢做成东西。 如果这些记录顺便能让别人看出我会写代码、会思考、会把事情推进,那就算额外收益。

Profile

我的背景不是单一路线:本科是物流工程,毕业后在拼多多多多买菜湖北配送团队做过一线业务执行;后来跨专业考研进入计算机方向,现在研究方向是弱监督文本驱动行人检索。

Direction

AI 应用和个人工作流

Agent Workflow、Tool Use、RAG、MCP、Dify 二次开发

我对“模型怎么变成日常可用的工具”比较感兴趣,尤其是从用户输入、结构化抽取、长期记忆、工具调用到发布部署的完整链路。

多模态和工程化

PyTorch、多模态检索、分布式训练、模型服务化

研究经历让我经常和 embedding、向量检索、模型训练、评估指标、部署环境打交道。很多文章会从这些具体问题展开。

Personal Knowledge Publishing Agent

最近最想做成的东西是一个基于 Dify 二次开发的个人知识沉淀与技术内容发布 Agent。它不是普通聊天机器人,也不是简单套壳博客生成器,而是想把“随手记下来的碎片”慢慢变成能检索、能回看、能写成文章的长期材料。

核心链路

碎片输入结构化 -> 长期记忆 / RAG -> 博客草稿生成 -> MCP 发布工具链

  • 用 FastAPI 封装结构化记录服务,定义 learning_note、project_update、interview_material 等记录类型。
  • 通过 Dify Knowledge Base 做语义检索与 metadata filter,沉淀学习记录、项目决策和写作素材。
  • 把草稿写入、frontmatter 校验、SEO 补全、死链检查、git push、Vercel 部署轮询封装为发布工具。
  • 用 dry-run、人工确认和执行日志降低真实仓库误操作风险,并用分类准确率、RAG 召回命中率、草稿可用率做评估。

Research

弱监督文本-图像行人检索

硕士研究课题,一作 IEEE TMM(CCF A)在审论文工作

  • 基于 ALBEF 视觉-语言预训练框架做跨模态检索研究。
  • 引入伪标签可靠性建模与边界样本校准机制,缓解弱监督噪声标签带来的对齐问题。
  • 在 CUHK-PEDES、ICFG-PEDES、RSTPReid 等公开数据集完成实验,负责 PyTorch pipeline、DDP 训练、日志归档和结果分析。

研究生数学建模大赛

围岩裂隙精准识别与三维模型重构,队长,国家级二等奖

主导图像预处理、裂隙检测 / 分割、三维重建、参数量化、误差分析和论文撰写,训练了把开放问题拆成可验证工程步骤的能力。

Experience

  • 2026.05
    跑通 Dify 1.14.2 本地 Docker Compose、FastAPI Custom Tool 和 Personal Knowledge Publishing Agent 的 dry-run smoke test。
  • 2026.03
    参加 WPS 菁英工程师培养计划 C++ / Qt 方向,完成 8 周桌面应用工程化训练并结业。
  • 2024.09
    进入华中师范大学计算机学院,研究方向为视觉-文本跨模态检索。
  • 2021
    本科毕业后在拼多多多多买菜湖北配送团队做区域配送业务执行,积累高节奏协作和问题闭环经验。

Blog

博客会优先写我真正折腾过的内容:Dify / Agent Workflow、RAG 评估、MCP 工具链、FastAPI 服务封装、Astro 发布工作流、多模态检索实验复盘,以及 AI 编程工具在真实项目里的使用边界。

我希望这里不是冷冰冰的作品列表,而是一个能持续留下思考、代码、失败和迭代痕迹的地方。

Contact

邮箱:1293909048@qq.com
GitHub:github.com/cxdpowered