从图灵测试到大语言模型,AI 走过了 70 多年的曲折历程。了解历史有助于理解当下。
艾伦·图灵发表《计算机器与智能》,提出"机器能否思考"的问题,并设计了衡量机器智能的"图灵测试",开启了 AI 的哲学讨论。
约翰·麦卡锡在达特茅斯会议上首次提出"人工智能"术语,马文·明斯基、赫伯特·西蒙等参与,标志着 AI 成为独立学科。
MIT 推出 ELIZA,模拟心理医生对话,是人机交互的开创性尝试,也揭示了人类容易对机器产生拟人化认知。
过高预期与实际能力的落差导致两次"AI 寒冬",政府和企业大幅削减 AI 研究资金。但专家系统在 80 年代短暂繁荣,证明了 AI 的商业价值。
IBM 深蓝系统在六局对弈中击败世界冠军卡斯帕罗夫,成为 AI 历史上的标志性事件,证明计算机在特定任务上可以超越人类。
Alex Krizhevsky 的 CNN 模型在 ImageNet 竞赛中大幅领先,将错误率降低近 10 个百分点,开启了深度学习的黄金时代。GPU 加速训练成为标配。
Ian Goodfellow 提出 GAN,两个网络相互博弈学习生成逼真数据,开创了生成式 AI 的新方向,影响了图像、音频、视频等多个领域。
DeepMind 的 AlphaGo 以 4:1 击败围棋世界冠军李世石,震惊全球。围棋曾被认为是 AI 无法征服的领域,这一胜利标志着深度强化学习的巨大突破。
Google 团队提出 Transformer 架构,完全基于注意力机制,抛弃了循环结构。这一架构成为 GPT、BERT 等现代 AI 模型的基石,彻底改变了 NLP 领域。
OpenAI 发布 GPT-3(1750 亿参数),展现惊人的 few-shot learning 能力。同年,扩散模型奠基论文发表,图像生成迎来新范式。
ChatGPT 上线两个月用户破亿,成为史上增长最快的消费级应用。DALL·E 2、Stable Diffusion 同期发布,AI 进入全民化时代。
GPT-4、Gemini 实现多模态能力;Claude 获得 Computer Use 能力;Sora 开创文生视频;2024 年诺贝尔物理学奖授予 AI 先驱辛顿,化学奖授予 AlphaFold 团队。
中国团队 DeepSeek 发布 R1 模型,以极低成本对标顶尖性能,引发全球关注。OpenAI o3、Claude 3.7 等推理模型问世,AI Agent 从概念走向落地。
从数学基础到前沿应用,循序渐进地构建你的 AI 知识体系。
线性代数、概率统计、微积分是理解 AI 的三大数学支柱。同时掌握 Python 编程以及 NumPy、Pandas 数据处理工具。不需要精通每个细节,但要建立直觉。推荐 3Blue1Brown 的可视化数学系列建立直觉,再用 Khan Academy 系统巩固。
理解监督学习、无监督学习、强化学习三大范式。掌握线性回归、逻辑回归、决策树、SVM、K-means、随机森林、XGBoost 等经典算法。学会用 Scikit-learn 实现模型训练与评估。重点理解偏差-方差权衡、交叉验证、特征工程。
深入神经网络原理:前馈网络、CNN、RNN、LSTM、Transformer 架构。掌握 PyTorch 框架,能够独立搭建和训练模型。理解反向传播、梯度下降、正则化、Batch Normalization、Dropout 等核心概念。
选择一个方向深耕:NLP(大语言模型、RAG、Agent)、CV(目标检测、图像分割、ViT)、强化学习(策略优化、多智能体)、生成式 AI(扩散模型、GAN、RLHF)、AI for Science(蛋白质预测、药物发现)。
参加 Kaggle 竞赛,复现经典论文,构建端到端的 AI 应用。学习 LLM 应用开发(LangChain、RAG、Agent)、模型部署(ONNX、TensorRT)、MLOps。关注 arXiv 最新论文、Papers With Code 排行榜。
AI 领域的八大核心方向,每个都值得深入探索。
回归分析、决策树与随机森林、SVM、K近邻、朴素贝叶斯、集成学习(XGBoost/LightGBM)。理解偏差-方差权衡、交叉验证、特征工程、超参数调优等关键概念。在表格数据场景中依然是最强方案。
从感知机到 Transformer,理解反向传播、梯度下降、正则化、Batch Normalization、Layer Normalization。掌握 CNN 的卷积/池化操作,RNN/LSTM 的序列建模,注意力机制的数学原理。
从词嵌入(Word2Vec、GloVe)到 BERT、GPT 系列,再到 LLaMA、Claude、DeepSeek 等现代 LLM。理解分词、命名实体识别、情感分析、文本生成、RAG 检索增强、AI Agent 智能体。
图像分类、目标检测(YOLO 系列、R-CNN)、语义分割、实例分割、姿态估计、OCR、图像生成。掌握 ResNet、EfficientNet、Vision Transformer(ViT)、SAM 等架构。
GAN、VAE、扩散模型(Stable Diffusion、DALL·E、Midjourney)、自回归模型(GPT)。理解 RLHF、DPO、Constitutional AI 等对齐技术,以及 Prompt Engineering、思维链(CoT)方法论。
Q-Learning、DQN、策略梯度、Actor-Critic、PPO、SAC 等核心算法。从 Atari 游戏到机器人控制,从 AlphaGo 到 RLHF,强化学习是让 AI 学会决策的关键技术。
算法偏见与公平性、模型可解释性(XAI)、隐私保护(联邦学习、差分隐私)、AI 安全对齐问题、对抗攻击与防御。了解欧盟《AI 法案》等全球监管动态和行业最佳实践。
模型训练效率优化(混合精度、分布式训练、DeepSpeed)。模型压缩(量化、蒸馏、剪枝)。部署技术(ONNX、TensorRT、vLLM)。实验管理(MLflow、W&B)。CI/CD 流水线与监控。
来自全球顶尖教育者的优质课程(视频版块开发中,敬请期待…)
官方双语 · 可视化解释神经网络工作原理,公认最佳入门资源,84万+ 播放
官方双语 · 深度学习第5章,直观理解 Transformer 架构,71万+ 播放
双语字幕 · 183集完整版,全球最经典的深度学习课程,体系化学习首选
中文世界最好的 ML 课程,涵盖 Transformer、GAN、RL 等,持续更新中
171集完整版 · 配套 D2L 教材,代码驱动,理论与实践完美结合
李沐老师亲授 · 从基础概念到前沿模型,配套完整代码和笔记
B站官方账号,可视化数学之美,线性代数/微积分/神经网络/Transformer 系列
PyTorch 动态神经网络教程、Numpy/Pandas/Matplotlib 数据处理全套课程
外影译坊配音版 3Blue1Brown 深度学习系列,更适合听力偏好中文的学习者
香港中文大学助理教授,强化学习纲要课程,从基础到高阶系统化讲解
高效的工具链是 AI 开发者的核心竞争力。
精选全球最优质的 AI 学习平台、课程和教材。
| 资源名称 | 类型 | 适合阶段 | 费用 | 链接 |
|---|---|---|---|---|
| 动手学深度学习 (D2L) | 交互式教材 | 初级→高级 | 免费 | d2l.ai |
| Fast.ai 实践课程 | 视频课程 | 初级→中级 | 免费 | fast.ai |
| Stanford CS224n NLP | 大学课程 | 中级→高级 | 免费 | Stanford |
| DeepLearning.AI 专项课 | 系列课程 | 初级→中级 | 认证付费 | deeplearning.ai |
| Kaggle Learn | 交互练习 | 初级 | 免费 | kaggle.com |
| MIT 6.S191 深度学习入门 | 大学课程 | 初级→中级 | 免费 | introtodeeplearning.com |
| Hugging Face 课程 | 交互教程 | 中级 | 免费 | huggingface.co |
| Google ML Crash Course | 在线课程 | 初级 | 免费 | Google ML |
| Full Stack Deep Learning | 视频课程 | 中级→高级 | 免费 | fullstackdeeplearning.com |
| 李宏毅机器学习(B 站) | 视频课程 | 初级→高级 | 免费 | bilibili.com |
| 李沐 动手学深度学习(B 站) | 视频课程 | 初级→高级 | 免费 | bilibili.com |
| Stanford CS231n 计算机视觉 | 大学课程 | 中级 | 免费 | Stanford |
| OpenAI Spinning Up RL | 教程文档 | 中级→高级 | 免费 | OpenAI |
| 王树森 深度强化学习(B 站) | 视频课程 | 中级→高级 | 免费 | bilibili.com |
从入门到进阶,这些书籍是 AI 学习者的案头必备。
用最少的数学公式、最通俗的语言讲透神经网络。纯 Python 实现,不依赖任何框架,入门首选。
深度学习领域的"圣经"级教材,全面覆盖理论基础。数学要求较高,适合系统化学习。
国内 ML 经典教材,涵盖感知机、SVM、EM、HMM、CRF 等算法,公式推导清晰严谨。
贝叶斯视角的机器学习经典,深入概率图模型。有免费 PDF 版。适合有概率论基础的读者。
配套代码的交互式教材,PyTorch/TensorFlow/MXNet 三版并行。免费在线阅读,有配套 B 站视频。
Scikit-learn 与 TensorFlow 实战指南,项目驱动学习。代码丰富,适合工程实践导向的学习者。
强化学习领域的开山之作,从多臂老虎机到策略梯度,理论完整且通俗。免费在线阅读。
NLP 领域最权威教材,第三版覆盖 Transformer 和预训练模型。免费在线草稿版持续更新。
这些论文定义了现代 AI 的发展方向,值得反复精读。
Goodfellow et al. · 生成对抗网络,两个网络相互博弈,开创生成式 AI 新纪元
arxiv.org/abs/1406.2661 →
He et al. · 残差连接解决深层网络退化问题,使训练上百层网络成为可能
arxiv.org/abs/1512.03385 →
Vaswani et al. · Transformer 架构,彻底改变了深度学习格局,GPT/BERT 的基础
arxiv.org/abs/1706.03762 →
Devlin et al. · 双向预训练语言模型,开启"预训练 + 微调"范式
arxiv.org/abs/1810.04805 →
Brown et al. · 1750 亿参数 LLM,展示 in-context learning 能力
arxiv.org/abs/2005.14165 →
Ho et al. · 扩散模型奠基论文,推动 Stable Diffusion 等图像生成技术爆发
arxiv.org/abs/2006.11239 →
Dosovitskiy et al. · Transformer 进军视觉领域,挑战 CNN 统治地位
arxiv.org/abs/2010.11929 →
Ouyang et al. · 提出 RLHF 方法,是 ChatGPT 的技术基础
arxiv.org/abs/2203.02155 →
Touvron et al. (Meta) · 开源 LLM 里程碑,引发开源大模型浪潮
arxiv.org/abs/2302.13971 →
DeepSeek AI · 以极低成本实现顶尖推理性能,中国团队在开源 LLM 领域的重大突破
arxiv.org/abs/2501.12948 →
AI 正在深刻改变几乎所有行业,了解应用场景有助于找到你的方向。
医学影像诊断(X光/CT/MRI 自动读片)、药物发现与分子设计、蛋白质结构预测(AlphaFold)、电子病历分析、个性化治疗方案
CV · NLP · AI4Science环境感知(激光雷达 + 摄像头融合)、路径规划、决策控制、高精地图、V2X 车路协同。代表:Waymo、Tesla FSD、百度 Apollo
CV · RL · 传感器融合量化交易与风险评估、反欺诈检测、智能客服、信用评分、保险精算、合规监测、知识图谱
NLP · 时序预测 · 图神经网络AI 绘画(Midjourney、Stable Diffusion)、AI 写作与编程(Claude、GPT)、AI 音乐生成(Suno)、AI 视频生成(Sora、可灵、即梦)
生成式 AI · 多模态工业质检(缺陷检测)、预测性维护、供应链优化、数字孪生、工业机器人控制、产品设计优化
CV · 时序分析 · 优化个性化学习路径、智能批改与评估、AI 助教(答疑/辅导)、知识图谱、自适应学习系统、语言学习
NLP · 推荐系统 · 知识图谱人形机器人(Tesla Optimus、Figure)、协作机器人、手术机器人、物流分拣机器人、具身智能
RL · CV · 控制论AI for Science:蛋白质折叠预测、气象预报(盘古气象)、材料发现、数学证明辅助、粒子物理分析
科学计算 · GNN · 模拟快速理解 AI 领域的核心概念和术语。
跟上 AI 领域日新月异的发展,这些社区和信息源不可或缺。
AI 论文预印本平台,每天追踪 cs.AI、cs.CL、cs.CV、cs.LG 分类的最新论文
论文 + 代码 + 排行榜三合一,快速了解各任务的 SOTA 模型和开源实现
AI 社区的 GitHub,托管模型、数据集、Spaces 应用,是 LLM 时代最重要的开源平台
Reddit 上最活跃的 ML 社区,论文讨论、行业新闻、求职经验分享
国内领先的 AI 媒体,论文解读、行业分析、技术教程,中文 AI 资讯首选
深度报道 AI 前沿技术与产业应用,涵盖学术、商业、政策等多维度
Andrew Ng 主编的 AI 周报,每周精选最重要的 AI 新闻和技术进展
开源代码平台,Star/Fork 热门 AI 项目,参与开源社区是最好的学习方式
数据科学竞赛平台,从入门教程到百万美元大赛,用实战检验你的 AI 能力
AI 学习者最常问的问题,为你一一解答。