扫街随拍

光影是城市的灵魂

云南旅图

把风花雪月装进口袋

写作碎片

生活中的只言片语

深夜食堂与未眠人

城市的夜晚总是比白天更诚实。街角的便利店灯光惨白,关东煮的热气在玻璃上晕开一片模糊的水雾。推门进来的人,大多带着一身疲惫,眼神里藏着不想对人言说的故事。

我坐在靠窗的位置,看着窗外偶尔驶过的出租车。司机们在这个巨大的钢筋森林里穿梭,像是在寻找出口,又像是在逃离什么。我们都是这城市里的未眠人,靠着一点微温的食物,慰藉着空荡荡的胃和心。

雨天的书店

下雨天躲进书店是一种特权。隔绝了外面的潮湿和喧嚣,纸张的味道混合着淡淡的咖啡香,让人感到莫名的安稳。

随手翻开一本旧书,扉页上写着:"送给2018年的自己"。不知道那位陌生人后来去了哪里,是否成为了想成为的人。书是时间的容器,我们在这里相遇,又在各自的时间线里继续前行。

技术笔记

AI 探索与工程实践

LLM 温度采样的本质

Temperature 是控制大模型输出随机性的关键参数。当 Temperature 接近 0 时,模型倾向于选择概率最高的 Token,输出趋于确定和保守;当 Temperature 升高时,低概率 Token 被选中的机会增加,输出更具创造性。

def sample(logits, temperature=1.0):
    if temperature == 0:
        return np.argmax(logits)
    
    # Apply temperature scaling
    scaled_logits = logits / temperature
    probabilities = softmax(scaled_logits)
    
    # Sample from the distribution
    return np.random.choice(len(logits), p=probabilities)

在实际产品中,对于代码生成等严谨场景,通常设置 Temp < 0.2;而对于创意写作,Temp > 0.7 往往能带来惊喜。

Embedding 微调实战

通用 Embedding 模型在垂直领域往往表现不佳。通过对比学习(Contrastive Learning)对 Embedding 进行微调,可以显著提升检索召回率。

关键在于构建高质量的正负样本对。正样本可以是(Query, Relevant Doc),负样本则通过 Hard Negative Mining 挖掘那些与 Query 相似但不相关的文档。

RAG 产品化的挑战

从 Demo 到生产环境,RAG(检索增强生成)面临诸多挑战:

1. 文档切分策略:简单的固定长度切分往往破坏语义,基于语义的切分或多级索引是更好的选择。
2. 引用归因:如何精准地告诉用户答案来自哪一段原文,是建立信任的关键。
3. 延迟优化:检索+重排序+生成,整个链路的耗时需要通过并行化和缓存来优化。

旅行日记

用脚步丈量世界

大理双廊:时间的褶皱

三月的双廊,阳光好得让人想流泪。洱海蓝得深邃,像一块巨大的蓝宝石镶嵌在苍山脚下。住在海边的客栈,每天醒来第一件事就是拉开窗帘看海。

在这里,时间仿佛失去了意义。没有打卡任务,没有行程表。只是坐在露台上发呆,看云卷云舒,看光影在海面上变幻。偶尔有海鸥掠过水面,激起一圈圈涟漪。原来生活可以这么慢,慢到能听见自己的心跳。

雨崩徒步:眼睛在天堂

"不去天堂,就去雨崩。" 这句话骗了多少人,也治愈了多少人。进山的路上,身体在地狱,每一步都在挑战极限;但当看到神女峰在夕阳下泛起金光的那一刻,觉得一切都值了。

在冰湖边,由于海拔过高,呼吸变得急促。四周是亿万年的冰川和巍峨的雪山,人类在自然面前显得如此渺小。那一刻,内心的杂念都被洗净,只剩下对自然的敬畏。

简历

AI 产品经理 · 计算机硕士

清华大学 (Tsinghua University)

2021.09 - 2024.06
计算机科学与技术(人工智能方向) · 硕士
  • 核心课程:机器学习(94/100)、自然语言处理(91/100)、计算机视觉(89/100)、产品设计与验证(93/100)
  • 研究课题:《基于多模态大模型的智能客服对话管理系统》(导师:李航团队),获国家奖学金
  • 技术实践:主导 Kaggle “AI+医疗影像分类”竞赛,Top 3%(团队贡献:数据标注方案设计+模型蒸馏优化)

某头部自动驾驶公司

2024.03 - 至今
AI 产品经理
  • 技术架构决策:主导车载多模态交互系统选型,对比 Llama2-70B+RAG 与 GPT-4 Turbo 方案,最终采用混合架构实现推理成本降低 40%,响应速度提升至 <3秒(日均处理 10万+ 次交互)。
  • 场景化功能设计
    • 开发“多轮导航纠偏”功能:通过用户轨迹数据挖掘高频纠偏场景(如立交桥、隧道),设计 3步意图澄清流程,减少无效交互 37%。
    • 构建“车内多设备协同”系统:打通手机/车机/智能家居 API,实现语音指令跨设备执行(如“关闭客厅空调”),用户 NPS 提升 28分。
  • 商业化落地
    • 推动与蔚来汽车合作,车载语音助手 DAU 突破 50万,功能使用率从 22% 提升至 61%(行业 Top 3 水平)。
    • 设计 B端客户定制方案:针对物流企业开发“疲劳驾驶监测+语音播报”模块,单客户 ARR 超 200万元。

某 SaaS 独角兽

2022.06 - 2024.02
智能营销产品经理
  • 数据体系搭建:设计 200+ 埋点事件的 CDP 数据模型,覆盖用户从广告点击到复购的全链路行为,支撑 AB 实验日处理量 10万+。
  • AI 功能迭代
    • 开发“智能素材生成器”:基于 GPT-3.5 微调行业专属模型,实现广告文案生成效率提升 80%,CTR 提高 15%。
    • 构建“用户流失预警系统”:通过 XGBoost+时序分析模型,提前 3天预测流失风险(准确率 89%),高价值客户留存率提升 18%。
  • 增长策略:设计“社交裂变+AI推荐”组合玩法,单月新增用户 15万,获客成本降低 32%。

项目经验:技术深度与业务价值并重

项目1:AI 知识库问答系统(零代码平台)

  • 技术架构:后端 LangChain+Qwen-72B 微调模型+Milvus 向量数据库;前端飞书多维表格+自定义 Prompt 模板引擎。
  • 核心创新
    • 开发“动态知识切片”算法:根据用户提问自动拆分知识库段落,提升长尾问题召回率 46%。
    • 设计“企业级权限控制”模块:支持部门级知识隔离与版本管理,已服务 50+ 中大型客户。
  • 业务成果:某银行客服中心问题解决率从 68% 提升至 89%,人力成本节省 120万/年。

项目2:AI+医疗影像辅助诊断系统

  • 技术突破
    • 改进 U-Net++ 网络结构,肺结节检测准确率从 89% 提升至 94%(在 LIDC-IDRI 数据集)。
    • 开发“医生-模型协同标注”工具,标注效率提升 3倍,数据集质量通过三甲医院认证。
  • 商业化路径:与华西医院合作获二类医疗器械认证;按例收费模式下,单医院年服务费 50万元+,已签约 12家三甲医院。

专业技能

  • 技术能力(硬技能)
    • 大模型:Qwen/MoE 架构选型经验、LoRA 微调、Prompt Engineering(掌握 50+ 场景模板)。
    • 工具链:LangChain 应用开发、PyTorch Lightning 分布式训练、MLOps 全流程(数据标注→模型监控)。
    • 数据:SQL 复杂查询(日均处理 TB 级数据)、Tableau 看板搭建、AB 实验设计(p-value < 0.05)。
  • 业务能力(软技能)
    • 需求分析:KANO 模型需求分级、Jobs-to-be-Done 框架应用。
    • 产品设计:用户旅程地图(含 10+ 医疗/汽车行业案例)、功能优先级矩阵(RICE 模型)。
    • 商业化:LTV/CAC 计算、定价策略设计(分层订阅/用量计费)、ROI 测算模板。

行业洞察与附加价值

  • 行业资源
    • 发表《大模型在工业质检中的落地陷阱与破局之道》等 5篇行业分析,被机器之心、量子位等媒体转载。
    • 担任中国人工智能产业发展联盟(AIIA)产品组专家,参与制定 2项行业标准。
  • 开源贡献
    • 维护 GitHub 开源项目“AI-Product-Toolkit”(Star 1.2K+),包含 Prompt 模板库、数据标注工具等。
    • 贡献 Hugging Face 模型库优化方案,被 Meta 采纳为官方文档案例。
下载完整简历 PDF