22 篇博文含有标签「人工智能」

人工智能和机器学习

AI 时代的领导力技能：超越传统管理

2025年10月9日 · 阅读需 15 分钟

软件工程师 & 开源爱好者

第一次，AI 系统对我的架构决策提出了不同意见，结果证明它是对的——那一刻，我意识到某些根本性的东西变了。变的不是 AI 本身，而是"领导力"这个词的含义。这不是关于技术升级的故事，而是关于领导者角色如何进化的故事。那些曾让我成功领导团队的技能并没有失效，但在 AI 参与的环境中，它们需要重新调整。

也许你作为技术领导者，也感受到了这种张力。研究表明，AI 确实能提升生产力，但效果因人而异——它绝非包治百病的灵丹妙药。你懂得那些经典的领导技能：技术深度、业务洞察、人际沟通、组织政治，它们依然重要。但 AI 带来了全新的维度，要求这些技能延展和适应。你的角色不再只是领导团队成员或使用工具，而是要协调一个混合生态——人的判断、管理智慧与 AI 能力，三者需要和谐共生。

从聊天机器人到智能代理：构建企业级LLM应用

2025年9月24日 · 阅读需 23 分钟

马老师 Marvin

软件工程师 & 开源爱好者

想象一个再熟悉不过的场景：周一上午，你又坐在会议室里复盘，为什么公司的 LLM 应用始终冲不出展示环境。团队已经搭了一个看起来很“聪明”的、由 GPT-4o 驱动的智能代理：能理解复杂客户咨询、通过函数调用串起内部系统，甚至还能看似自主地编排多步骤流程。那时领导层一度热情高涨，预算批得很快，Roadmap 也写得漂亮。可六个月过去，项目仍困在资深从业者口中的 demo hell（“演示炼狱”）——永远在演示，始终不上真正可承压的生产。

如果你瞬间代入，这不是偶然共鸣——而是当今企业的常态。如果这个场景听起来很熟悉，你并不孤单。无论组织是使用托管API（如GPT-4o、Claude Sonnet 4和Gemini 2.5 Pro）构建，还是部署自托管模型（如DeepSeek-R1、QwQ、Gemma 3和Phi 4），绝大多数都难以超越实验性试点项目。正如我在AI生产力研究分析中探讨的，AI的生产力效益高度依赖于具体情境，结构化方法显著优于临时性使用。瓶颈不在于你的LLM集成的复杂性、托管与自托管模型的选择，或者你的AI开发团队的才能。而在于更根本的东西：LLM应用底层的数据基础。

真正卡住企业级 LLM 应用的，不是“模型选哪个”，而是：能不能在对的时间，把对的数据，以可追溯、可度量、可治理的方式送到模型面前。 你的“智能”代理，其上限只等于你数据基础设施的下限。

如果你尝试把一个惊艳的演示推向生产，结果被碎片化系统、不一致 API、缺失血缘、检索漂移、缓存陈旧这些细碎又顽固的阻力磨掉耐心——这篇文章就是写给你的。我们的基本立场很直接：企业级 LLM 应用的成功，不取决于提示技巧或代理框架炫不炫，而取决于是否有一套为“程序化智能消费”而设计的数据底座。

接下来我们会按层拆开：数据可访问性如何悄悄钳制模型表现；哪些数据与上下文管理模式让工具调用真正可靠；面向 LLM 特有风险的治理如何设计；以及如何把这些理念落成可以扩展、可演进的生产体系。

答案从来不是“多写几个高阶提示”或者“再换个更大模型”——而是重建数据基础。下面先从问题底层结构讲起。

规格驱动开发：复杂功能的系统性方法

2025年9月16日 · 阅读需 19 分钟

马老师 Marvin

软件工程师 & 开源爱好者

引言：复杂功能开发的挑战

每个开发者都知道那种盯着复杂需求而不知从何开始的感觉。现代软件开发越来越多地涉及构建整合多个服务、处理不同数据格式、协调各种 API 的系统。在初始规格中看似简单的东西，往往会演变成复杂的相互依赖组件网络，每个组件都有自己的约束和边界条件。

这种复杂性在几个常见的开发挑战中显现出来，无论团队的经验水平或技术栈如何，都会面临这些挑战。项目经常因为需求在实现过程中的演变而遭受范围蔓延。开发者花费大量时间向 AI 助手或团队成员解释上下文，经常重复相同的架构约束。技术债务在开发者因压力做出仓促决定时累积，导致系统变得越来越难以维护和扩展。

上下文工程：AI系统中信息选择的艺术

2025年9月14日 · 阅读需 15 分钟

马老师 Marvin

软件工程师 & 开源爱好者

"上下文工程是构建动态系统，以正确格式提供正确信息和工具，使LLM能够合理完成任务的方法。" — LangChain

如果你使用AI开发应用有一段时间了，你可能已经遇到了简单提示词不再足够的瓶颈。你精心制作的提示在边缘情况下失效，你的AI助手在处理复杂任务时变得混乱，你的应用程序难以维持连贯的对话。这些挫折并非偶然——它们揭示了AI开发中正在发生的根本性转变。

像OpenAI、Anthropic、Notion和GitHub这样的公司不仅在构建更好的模型，他们还在开创全新的信息、工具和结构流向AI系统的方法。这就是上下文工程的本质。

无人值守的AI编程：使用GitHub Copilot Agent进行内容迁移的体验

2025年9月10日 · 阅读需 7 分钟

马老师 Marvin

软件工程师 & 开源爱好者

引言

最近，我使用 GitHub Copilot Agent 成功将所有存档的markdown文章迁移到这个基于Docusaurus的博客，这个体验出乎意料地顺畅高效。最让我印象深刻的不仅是AI处理重复任务的能力，还有我能够引导它自主工作，而我可以专注于更高层次的决策。更令人着迷的是，我甚至可以在通勤或休息时用手机来审查和引导AI代理的工作。这次体验从根本上改变了我对AI辅助开发工作流的看法。

以下是迁移完成后的中英文博客展示：

图1：迁移效果一览（中文）

图2：迁移效果一览（英文）

Vercel AI SDK：加速 AI 应用构建的完整解决方案

2025年8月19日 · 阅读需 18 分钟

马老师 Marvin

软件工程师 & 开源爱好者

作为一名开发者，如果你想快速构建 AI 驱动的应用，Vercel AI SDK 是一个理想的选择。它是一个开源的 TypeScript 工具包，由 Next.js 的创建者开发而成，旨在简化 AI 集成过程，让你专注于业务逻辑而非底层复杂性。通过统一的 API、多提供商支持和流式响应等特性，它显著降低了开发门槛，帮助开发者在短时间内从概念到上线。在这篇技术博客中，我将从概述、核心优势、实际示例、与其他工具的比较、真实世界应用案例、社区反馈、潜在挑战等方面主张：我们应该利用 Vercel AI SDK 来加速 AI 应用的构建。特别值得一提的是，其新推出的 AI Elements 组件库，作为开箱即用的 AI 应用 UI 框架，与 AI SDK 深度集成，提供极高的扩展性和自定义能力，进一步提升了开发效率。

POML：结构化提示工程的兴起与AI应用架构的“新三驾马车”展望

2025年8月15日 · 阅读需 12 分钟

马老师 Marvin

软件工程师 & 开源爱好者

引言

在人工智能（AI）飞速发展的今天，提示工程（Prompt Engineering）正从一门依赖直觉的“艺术”转型为系统化的“工程”实践。微软于2025年推出的POML（Prompt Orchestration Markup Language）作为一种结构化标记语言，为这一变革注入了新动力。POML不仅解决了传统提示工程的混乱与低效，还预示着AI应用架构可能迎来类似Web开发的“HTML/CSS/JS三驾马车”范式。本文基于一份深入研究报告，详细剖析POML的核心技术、与Web架构的类比、实际应用场景以及未来潜力，为开发者与企业提供可操作的洞见。

POML开启提示工程新纪元

POML由微软研究院推出，其设计灵感源自HTML和XML，旨在通过模块化、语义化的标签（如<role>、<task>）将复杂的提示分解为清晰的组件，解决传统“提示意面”（Prompt Spaghetti）的痛点。它通过以下特性重塑提示工程：

语义化标签：提升提示的可读性、可维护性和可重用性。
多模态支持：无缝整合文本、表格、图像等数据。
样式系统：受CSS启发，分离内容与呈现，简化A/B测试。
动态模板：支持变量、循环和条件，实现自动化和个性化。

POML不仅是一门语言，更是AI应用架构的结构层，与优化工具（如PromptPerfect）和编排框架（如LangChain）共同构成“新三驾马车”。这一架构与学术界提出的“提示分层架构”（Prompt-Layered Architecture, PLA）理论高度契合，将提示管理提升为与传统软件开发同等重要的“第一公民”。

未来，POML有望成为多智能体系统（Multi-Agent Systems）的“通信协议”和“配置语言”，为构建可扩展、可审计的AI应用奠定基础。尽管社区对其复杂性存在争议，但其潜力不可忽视。本文将为开发者提供实用建议，助力企业拥抱这一变革。

斯坦福大学研究揭示AI对开发者生产力的真实影响：并非万能灵丹

2025年8月5日 · 阅读需 10 分钟

马老师 Marvin

软件工程师 & 开源爱好者

本文内容基于斯坦福大学研究员 Yegor Denisov-Blanch 在 AIEWF 2025 大会上的演讲，该研究分析了来自数百家公司的近10万名开发者的真实数据。感兴趣并有条件的可以去 YouTube 观看全部演讲内容。

最近，“AI将取代软件工程师”的论调甚嚣尘上。Meta的马克·扎克伯格（Mark Zuckerberg）甚至在今年年初表示，他计划在年底前用AI取代公司所有中级工程师。这种愿景无疑能鼓舞人心，但也给全球的技术决策者带来了压力：“我们离用AI取代所有开发者还有多远？”

斯坦福大学软件工程生产力研究团队的最新发现，为这个问题提供了一个更现实、更细致的答案。经过对近10万名软件工程师、600多家公司、数千万次提交以及数十亿行私有代码库数据的深入分析，这项大规模研究表明：人工智能确实可以提升开发者生产力，但它绝非一个“一劳永逸”的万能解决方案，其影响是高度情境化且充满细微差别的。虽然平均生产力提升了约20%，但在某些情况下，AI甚至可能适得其反，降低生产力。

DeepSeek：技术民主化的先锋，还是搅局者？

2025年2月11日 · 阅读需 10 分钟

马老师 Marvin

软件工程师 & 开源爱好者

引言

"预测未来的最好方式，就是去创造未来。" —— 彼得·德鲁克 (Peter Drucker)

2022年，OpenAI 的 ChatGPT 横空出世，以其前所未有的智能水平，瞬间点燃了全球对人工智能技术的狂热。这场由大型语言模型（LLM）引发的技术浪潮，犹如一场"技术爆炸"，不仅让大众惊叹于 AI 的潜力，更深刻地改变了我们对未来科技发展方向的认知。从那时起，科技巨头们纷纷加入战局，竞相推出更强大、更经济的 AI 模型，试图在这场竞赛中占据领先地位。成本的持续降低和性能的不断提升，似乎预示着一个触手可及的 AI 普惠时代。

然而，当我们将目光聚焦于这场技术盛宴的核心——大语言模型本身时，却发现一个有趣的现象：尽管参与者众多，但真正能被称为"现象级"的，似乎只有 DeepSeek 一家。这家被誉为 "AI界拼多多" 的公司，以其惊人的低成本和开源策略，迅速在全球范围内引发热议，甚至被一些人视为"技术民主化"的先锋。那么，DeepSeek 的爆红仅仅是因为价格优势吗？它真的能撼动现有 AI 格局，成为颠覆性创新的代表吗？还是说，它仅仅是技术巨头竞争格局中的一个搅局者？本文将深入探讨 DeepSeek 现象背后的深层原因，剖析其在全球 AI 领域迅速崛起的真正动因，以及它为整个行业带来的启示。

基于大语言模型（LLM）的人工智能能否引领新的工业革命？

2024年8月31日 · 阅读需 16 分钟

马老师 Marvin

软件工程师 & 开源爱好者

前言

“如果我们的时代是下一个工业革命，正如许多人所声称的那样，人工智能无疑是其驱动力之一。” -- 李飞飞《纽约时代周刊》专栏文章

距离 OpenAI 开发的划时代人工智能产品 ChatGPT 于 2022 年末面世，已经过去接近 2 年。这款强大的语言模型不仅激发了公众对人工智能的广泛关注，更点燃了业界对人工智能在各行各业应用潜力的无限想象。从那时起，大语言模型（LLM）以其强大的文本生成、理解和推理能力，迅速成为人工智能领域的焦点，并被视为引领新一轮工业革命的关键技术之一。风险投资数据平台 PitchBook 公布的数据显示，在今年 4-6 月，美国 AI 初创企业获得了 270 多亿融资，占总融资额的一半。

然而，随着人们不断惊讶于人工智能神奇能力的同时，也逐渐意识到 AI 当前存在的一些问题：幻觉（Hallucination）、效率、成本问题等。笔者在过去一段时间在工作和项目中或多或少实践过基于 LLM 的人工智能技术，对其原理及应用场景有一定理解，希望借助本文将目前 LLM 的心得所感分享给读者。

引言：复杂功能开发的挑战​

引言​

引言​

POML开启提示工程新纪元​

引言​

前言​

LLM 原理​

引言：复杂功能开发的挑战

引言

引言

POML开启提示工程新纪元

引言

前言

LLM 原理