Yunqing
首页 文章 作品集 标签 归档 搜索 关于
首页 文章 作品集 标签 归档 搜索 关于

文章

关于编程、设计与生活的碎片思考

2026年1月7日 6 分钟

「强化学习」到底是个啥?

强化学习是机器学习三大范式之一。智能体在环境中通过试错,学习如何最大化长期奖励。本文从零讲清楚 MDP 框架、贝尔曼方程、三大算法流派,以及 RLHF 如何训练 ChatGPT。

强化学习AI机器学习
2026年1月3日 8 分钟

如何写一个好的提示词🤔

同样的 AI,为什么有人用出了效率神器,有人却只能得到废话?这篇文章拆解 Prompt Engineering 的底层逻辑,教你从 GIGO 走向精准掌控。

AIPromptChatGPT
2026年1月1日 1 分钟

欢迎来到我的博客

这是我用 Hugo + PaperMod 搭建的个人博客的第一篇文章,记录一个开始。

生活开始
上一页 第 4 / 4 页

© 2026 Yunqing · 用心记录,安静生长