2025-2026 · 持续更新

从零开始
掌握人工智能

系统化的 AI 学习指南,涵盖机器学习、深度学习、自然语言处理、计算机视觉、强化学习、生成式 AI 等核心领域。精选全球优质免费资源,为你打造最高效的学习路径。

12
内容板块
80+
精选资源
10+
B站视频
100%
免费开放

人工智能发展简史

从图灵测试到大语言模型,AI 走过了 70 多年的曲折历程。了解历史有助于理解当下。

1950

图灵测试

艾伦·图灵发表《计算机器与智能》,提出"机器能否思考"的问题,并设计了衡量机器智能的"图灵测试",开启了 AI 的哲学讨论。

1956

达特茅斯会议 — AI 正式诞生

约翰·麦卡锡在达特茅斯会议上首次提出"人工智能"术语,马文·明斯基、赫伯特·西蒙等参与,标志着 AI 成为独立学科。

1966

ELIZA — 首个聊天机器人

MIT 推出 ELIZA,模拟心理医生对话,是人机交互的开创性尝试,也揭示了人类容易对机器产生拟人化认知。

1974-1993

AI 寒冬

过高预期与实际能力的落差导致两次"AI 寒冬",政府和企业大幅削减 AI 研究资金。但专家系统在 80 年代短暂繁荣,证明了 AI 的商业价值。

1997

深蓝击败国际象棋冠军

IBM 深蓝系统在六局对弈中击败世界冠军卡斯帕罗夫,成为 AI 历史上的标志性事件,证明计算机在特定任务上可以超越人类。

2012

AlexNet — 深度学习革命

Alex Krizhevsky 的 CNN 模型在 ImageNet 竞赛中大幅领先,将错误率降低近 10 个百分点,开启了深度学习的黄金时代。GPU 加速训练成为标配。

2014

GAN 生成对抗网络

Ian Goodfellow 提出 GAN,两个网络相互博弈学习生成逼真数据,开创了生成式 AI 的新方向,影响了图像、音频、视频等多个领域。

2016

AlphaGo 击败李世石

DeepMind 的 AlphaGo 以 4:1 击败围棋世界冠军李世石,震惊全球。围棋曾被认为是 AI 无法征服的领域,这一胜利标志着深度强化学习的巨大突破。

2017

Transformer — Attention Is All You Need

Google 团队提出 Transformer 架构,完全基于注意力机制,抛弃了循环结构。这一架构成为 GPT、BERT 等现代 AI 模型的基石,彻底改变了 NLP 领域。

2020

GPT-3 — 大语言模型崛起

OpenAI 发布 GPT-3(1750 亿参数),展现惊人的 few-shot learning 能力。同年,扩散模型奠基论文发表,图像生成迎来新范式。

2022

ChatGPT 引爆全球

ChatGPT 上线两个月用户破亿,成为史上增长最快的消费级应用。DALL·E 2、Stable Diffusion 同期发布,AI 进入全民化时代。

2023-2024

多模态与 AI Agent 时代

GPT-4、Gemini 实现多模态能力;Claude 获得 Computer Use 能力;Sora 开创文生视频;2024 年诺贝尔物理学奖授予 AI 先驱辛顿,化学奖授予 AlphaFold 团队。

2025

DeepSeek-R1 与推理模型

中国团队 DeepSeek 发布 R1 模型,以极低成本对标顶尖性能,引发全球关注。OpenAI o3、Claude 3.7 等推理模型问世,AI Agent 从概念走向落地。

学习路径规划

从数学基础到前沿应用,循序渐进地构建你的 AI 知识体系。

阶段一 · 2-4 周

数学与编程基础

线性代数、概率统计、微积分是理解 AI 的三大数学支柱。同时掌握 Python 编程以及 NumPy、Pandas 数据处理工具。不需要精通每个细节,但要建立直觉。推荐 3Blue1Brown 的可视化数学系列建立直觉,再用 Khan Academy 系统巩固。

阶段二 · 4-6 周

机器学习基础

理解监督学习、无监督学习、强化学习三大范式。掌握线性回归、逻辑回归、决策树、SVM、K-means、随机森林、XGBoost 等经典算法。学会用 Scikit-learn 实现模型训练与评估。重点理解偏差-方差权衡、交叉验证、特征工程。

阶段三 · 6-8 周

深度学习进阶

深入神经网络原理:前馈网络、CNN、RNN、LSTM、Transformer 架构。掌握 PyTorch 框架,能够独立搭建和训练模型。理解反向传播、梯度下降、正则化、Batch Normalization、Dropout 等核心概念。

阶段四 · 4-6 周

专业方向深入

选择一个方向深耕:NLP(大语言模型、RAG、Agent)、CV(目标检测、图像分割、ViT)、强化学习(策略优化、多智能体)、生成式 AI(扩散模型、GAN、RLHF)、AI for Science(蛋白质预测、药物发现)。

阶段五 · 持续

项目实战与前沿跟踪

参加 Kaggle 竞赛,复现经典论文,构建端到端的 AI 应用。学习 LLM 应用开发(LangChain、RAG、Agent)、模型部署(ONNX、TensorRT)、MLOps。关注 arXiv 最新论文、Papers With Code 排行榜。

核心知识模块

AI 领域的八大核心方向,每个都值得深入探索。

机器学习
机器学习

经典机器学习算法

回归分析、决策树与随机森林、SVM、K近邻、朴素贝叶斯、集成学习(XGBoost/LightGBM)。理解偏差-方差权衡、交叉验证、特征工程、超参数调优等关键概念。在表格数据场景中依然是最强方案。

深度学习
深度学习

神经网络与深度学习

从感知机到 Transformer,理解反向传播、梯度下降、正则化、Batch Normalization、Layer Normalization。掌握 CNN 的卷积/池化操作,RNN/LSTM 的序列建模,注意力机制的数学原理。

NLP
自然语言处理

NLP 与大语言模型

从词嵌入(Word2Vec、GloVe)到 BERT、GPT 系列,再到 LLaMA、Claude、DeepSeek 等现代 LLM。理解分词、命名实体识别、情感分析、文本生成、RAG 检索增强、AI Agent 智能体。

计算机视觉
计算机视觉

计算机视觉与图像理解

图像分类、目标检测(YOLO 系列、R-CNN)、语义分割、实例分割、姿态估计、OCR、图像生成。掌握 ResNet、EfficientNet、Vision Transformer(ViT)、SAM 等架构。

生成式AI
生成式 AI

生成式人工智能

GAN、VAE、扩散模型(Stable Diffusion、DALL·E、Midjourney)、自回归模型(GPT)。理解 RLHF、DPO、Constitutional AI 等对齐技术,以及 Prompt Engineering、思维链(CoT)方法论。

强化学习
强化学习

强化学习与决策智能

Q-Learning、DQN、策略梯度、Actor-Critic、PPO、SAC 等核心算法。从 Atari 游戏到机器人控制,从 AlphaGo 到 RLHF,强化学习是让 AI 学会决策的关键技术。

AI伦理
AI 伦理与安全

负责任的 AI 开发

算法偏见与公平性、模型可解释性(XAI)、隐私保护(联邦学习、差分隐私)、AI 安全对齐问题、对抗攻击与防御。了解欧盟《AI 法案》等全球监管动态和行业最佳实践。

MLOps
工程化与部署

MLOps 与模型部署

模型训练效率优化(混合精度、分布式训练、DeepSpeed)。模型压缩(量化、蒸馏、剪枝)。部署技术(ONNX、TensorRT、vLLM)。实验管理(MLflow、W&B)。CI/CD 流水线与监控。

精选视频教程

来自全球顶尖教育者的优质课程(视频版块开发中,敬请期待…)

【3Blue1Brown】深度学习之神经网络的结构

官方双语 · 可视化解释神经网络工作原理,公认最佳入门资源,84万+ 播放

【3Blue1Brown】GPT 是什么?直观解释 Transformer

官方双语 · 深度学习第5章,直观理解 Transformer 架构,71万+ 播放

【吴恩达】深度学习 deeplearning.ai 全集

双语字幕 · 183集完整版,全球最经典的深度学习课程,体系化学习首选

【李宏毅】2025/2026 机器学习 & 深度学习

中文世界最好的 ML 课程,涵盖 Transformer、GAN、RL 等,持续更新中

【李沐】动手学深度学习 PyTorch 版全集

171集完整版 · 配套 D2L 教材,代码驱动,理论与实践完美结合

【李沐】动手学深度学习(第一版经典)

李沐老师亲授 · 从基础概念到前沿模型,配套完整代码和笔记

📺 更多 B 站推荐频道

3Blue1Brown

B站官方账号,可视化数学之美,线性代数/微积分/神经网络/Transformer 系列

莫烦 Python

PyTorch 动态神经网络教程、Numpy/Pandas/Matplotlib 数据处理全套课程

3B1B 深度学习(中文配音)

外影译坊配音版 3Blue1Brown 深度学习系列,更适合听力偏好中文的学习者

周博磊 强化学习

香港中文大学助理教授,强化学习纲要课程,从基础到高阶系统化讲解

必备工具与框架

高效的工具链是 AI 开发者的核心竞争力。

Py

PyTorch

最流行的深度学习框架,灵活动态图,学术研究首选

pytorch.org →
TF

TensorFlow

Google 开源框架,适合生产环境和移动端部署

tensorflow.org →
🤗

Hugging Face

模型仓库与 NLP 工具链,LLM 时代的 GitHub

huggingface.co →
Jx

JAX

Google 高性能数值计算库,自动微分和 XLA 加速

jax.readthedocs.io →
Jp

Jupyter

交互式开发环境,数据探索与实验的最佳工具

jupyter.org →
LC

LangChain

LLM 应用开发框架,快速构建 Agent 和 RAG

langchain.com →
W&B

Weights & Biases

实验追踪与模型可视化,ML 团队协作利器

wandb.ai →
SK

Scikit-learn

传统 ML 算法库,数据预处理与模型评估标准工具

scikit-learn.org →
vL

vLLM

高吞吐 LLM 推理引擎,PagedAttention 技术

GitHub →
DS

DeepSpeed

微软大模型训练框架,ZeRO 优化器,多 GPU 并行

deepspeed.ai →

学习资源推荐

精选全球最优质的 AI 学习平台、课程和教材。

资源名称类型适合阶段费用链接
动手学深度学习 (D2L)交互式教材初级→高级免费d2l.ai
Fast.ai 实践课程视频课程初级→中级免费fast.ai
Stanford CS224n NLP大学课程中级→高级免费Stanford
DeepLearning.AI 专项课系列课程初级→中级认证付费deeplearning.ai
Kaggle Learn交互练习初级免费kaggle.com
MIT 6.S191 深度学习入门大学课程初级→中级免费introtodeeplearning.com
Hugging Face 课程交互教程中级免费huggingface.co
Google ML Crash Course在线课程初级免费Google ML
Full Stack Deep Learning视频课程中级→高级免费fullstackdeeplearning.com
李宏毅机器学习(B 站)视频课程初级→高级免费bilibili.com
李沐 动手学深度学习(B 站)视频课程初级→高级免费bilibili.com
Stanford CS231n 计算机视觉大学课程中级免费Stanford
OpenAI Spinning Up RL教程文档中级→高级免费OpenAI
王树森 深度强化学习(B 站)视频课程中级→高级免费bilibili.com

推荐书籍

从入门到进阶,这些书籍是 AI 学习者的案头必备。

📗

深度学习入门:基于 Python 的理论与实现

斋藤康毅

用最少的数学公式、最通俗的语言讲透神经网络。纯 Python 实现,不依赖任何框架,入门首选。

📘

Deep Learning (花书)

Goodfellow, Bengio, Courville

深度学习领域的"圣经"级教材,全面覆盖理论基础。数学要求较高,适合系统化学习。

📙

统计学习方法

李航

国内 ML 经典教材,涵盖感知机、SVM、EM、HMM、CRF 等算法,公式推导清晰严谨。

📕

Pattern Recognition and Machine Learning

Christopher Bishop

贝叶斯视角的机器学习经典,深入概率图模型。有免费 PDF 版。适合有概率论基础的读者。

📓

动手学深度学习 (D2L)

李沐 等

配套代码的交互式教材,PyTorch/TensorFlow/MXNet 三版并行。免费在线阅读,有配套 B 站视频。

📒

Hands-On Machine Learning

Aurélien Géron

Scikit-learn 与 TensorFlow 实战指南,项目驱动学习。代码丰富,适合工程实践导向的学习者。

📔

Reinforcement Learning: An Introduction

Sutton & Barto

强化学习领域的开山之作,从多臂老虎机到策略梯度,理论完整且通俗。免费在线阅读。

📖

Speech and Language Processing

Jurafsky & Martin

NLP 领域最权威教材,第三版覆盖 Transformer 和预训练模型。免费在线草稿版持续更新。

必读经典论文

这些论文定义了现代 AI 的发展方向,值得反复精读。

2014

Generative Adversarial Networks (GAN)

Goodfellow et al. · 生成对抗网络,两个网络相互博弈,开创生成式 AI 新纪元
arxiv.org/abs/1406.2661 →

2015

Deep Residual Learning (ResNet)

He et al. · 残差连接解决深层网络退化问题,使训练上百层网络成为可能
arxiv.org/abs/1512.03385 →

2017

Attention Is All You Need

Vaswani et al. · Transformer 架构,彻底改变了深度学习格局,GPT/BERT 的基础
arxiv.org/abs/1706.03762 →

2018

BERT: Pre-training of Deep Bidirectional Transformers

Devlin et al. · 双向预训练语言模型,开启"预训练 + 微调"范式
arxiv.org/abs/1810.04805 →

2020

Language Models are Few-Shot Learners (GPT-3)

Brown et al. · 1750 亿参数 LLM,展示 in-context learning 能力
arxiv.org/abs/2005.14165 →

2020

Denoising Diffusion Probabilistic Models

Ho et al. · 扩散模型奠基论文,推动 Stable Diffusion 等图像生成技术爆发
arxiv.org/abs/2006.11239 →

2021

An Image is Worth 16x16 Words (ViT)

Dosovitskiy et al. · Transformer 进军视觉领域,挑战 CNN 统治地位
arxiv.org/abs/2010.11929 →

2022

Training LMs to Follow Instructions (InstructGPT)

Ouyang et al. · 提出 RLHF 方法,是 ChatGPT 的技术基础
arxiv.org/abs/2203.02155 →

2023

LLaMA: Open and Efficient Foundation Language Models

Touvron et al. (Meta) · 开源 LLM 里程碑,引发开源大模型浪潮
arxiv.org/abs/2302.13971 →

2025

DeepSeek-R1

DeepSeek AI · 以极低成本实现顶尖推理性能,中国团队在开源 LLM 领域的重大突破
arxiv.org/abs/2501.12948 →

AI 行业应用全景

AI 正在深刻改变几乎所有行业,了解应用场景有助于找到你的方向。

🏥

医疗健康

医学影像诊断(X光/CT/MRI 自动读片)、药物发现与分子设计、蛋白质结构预测(AlphaFold)、电子病历分析、个性化治疗方案

CV · NLP · AI4Science
🚗

自动驾驶

环境感知(激光雷达 + 摄像头融合)、路径规划、决策控制、高精地图、V2X 车路协同。代表:Waymo、Tesla FSD、百度 Apollo

CV · RL · 传感器融合
💰

金融科技

量化交易与风险评估、反欺诈检测、智能客服、信用评分、保险精算、合规监测、知识图谱

NLP · 时序预测 · 图神经网络
🎨

创意与内容

AI 绘画(Midjourney、Stable Diffusion)、AI 写作与编程(Claude、GPT)、AI 音乐生成(Suno)、AI 视频生成(Sora、可灵、即梦)

生成式 AI · 多模态
🏭

智能制造

工业质检(缺陷检测)、预测性维护、供应链优化、数字孪生、工业机器人控制、产品设计优化

CV · 时序分析 · 优化
🎓

教育

个性化学习路径、智能批改与评估、AI 助教(答疑/辅导)、知识图谱、自适应学习系统、语言学习

NLP · 推荐系统 · 知识图谱
🤖

机器人

人形机器人(Tesla Optimus、Figure)、协作机器人、手术机器人、物流分拣机器人、具身智能

RL · CV · 控制论
🔬

科学研究

AI for Science:蛋白质折叠预测、气象预报(盘古气象)、材料发现、数学证明辅助、粒子物理分析

科学计算 · GNN · 模拟

AI 术语速查表

快速理解 AI 领域的核心概念和术语。

神经网络 Neural Network
受生物神经系统启发的计算模型,由大量互连节点组成,通过调整连接权重来学习数据中的模式。
反向传播 Backpropagation
训练神经网络的核心算法,通过链式法则从输出层向输入层逐层计算梯度,并据此更新网络权重。
Transformer
基于自注意力机制的架构,完全摒弃循环结构,能并行处理序列数据。GPT、BERT 等的基础。
注意力机制 Attention
让模型动态关注序列不同位置信息。自注意力(Self-Attention)让每个位置都能关注其他所有位置。
迁移学习 Transfer Learning
将大规模预训练模型迁移到特定任务,通过微调用少量数据即可获得优异表现。
过拟合 Overfitting
模型在训练数据上极好但泛化能力差。常用正则化、Dropout、数据增强等方法缓解。
梯度下降 Gradient Descent
沿损失函数梯度反方向迭代更新参数的优化算法。变体包括 SGD、Adam、AdamW 等。
嵌入 Embedding
将离散对象映射到连续向量空间,使语义相似的对象在向量空间中距离相近。
大语言模型 LLM
参数量数十亿到数千亿的语言模型,通过预训练获得文本理解和生成能力,涌现出推理、代码生成等能力。
RAG 检索增强生成
结合检索和生成的技术,在生成回答前先从外部知识库检索相关信息,提升准确性和时效性。
扩散模型 Diffusion Model
通过逐步添加噪声再去噪来生成数据,在图像生成领域表现卓越,代表有 Stable Diffusion、DALL·E。
RLHF
通过人类反馈进行强化学习,使模型输出更符合人类偏好,是对齐技术的核心方法。
AI Agent 智能体
能自主规划、决策并执行任务的 AI 系统,结合 LLM 推理、工具调用、记忆系统实现复杂任务自动化。
MoE 混合专家模型
Mixture of Experts,将模型分为多个"专家"子网络,每次推理只激活部分专家,大幅降低计算成本。
思维链 Chain-of-Thought
提示 LLM 逐步推理的技术,通过分解复杂问题为中间步骤,显著提升数学和逻辑推理能力。
知识蒸馏 Distillation
将大模型(教师)的知识转移到小模型(学生)中,在保持较高性能的同时大幅减小模型体积和推理成本。

社区与信息源

跟上 AI 领域日新月异的发展,这些社区和信息源不可或缺。

arXiv

AI 论文预印本平台,每天追踪 cs.AI、cs.CL、cs.CV、cs.LG 分类的最新论文

Papers With Code

论文 + 代码 + 排行榜三合一,快速了解各任务的 SOTA 模型和开源实现

Hugging Face

AI 社区的 GitHub,托管模型、数据集、Spaces 应用,是 LLM 时代最重要的开源平台

r/MachineLearning

Reddit 上最活跃的 ML 社区,论文讨论、行业新闻、求职经验分享

机器之心

国内领先的 AI 媒体,论文解读、行业分析、技术教程,中文 AI 资讯首选

雷锋网 AI

深度报道 AI 前沿技术与产业应用,涵盖学术、商业、政策等多维度

The Batch

Andrew Ng 主编的 AI 周报,每周精选最重要的 AI 新闻和技术进展

GitHub

开源代码平台,Star/Fork 热门 AI 项目,参与开源社区是最好的学习方式

Kaggle

数据科学竞赛平台,从入门教程到百万美元大赛,用实战检验你的 AI 能力

常见问题

AI 学习者最常问的问题,为你一一解答。

学 AI 需要什么数学基础?
核心需要三大数学领域:线性代数(矩阵运算、特征分解、SVD)、概率与统计(贝叶斯定理、分布、假设检验)、微积分(偏导数、链式法则、梯度)。不需要数学专业水平,但要能理解公式背后的直觉。推荐从 3Blue1Brown 的「线性代数的本质」和「微积分的本质」系列视频开始(B 站有官方双语版)。
Python 要学到什么程度?
掌握基础语法、面向对象编程、常用数据结构即可。重点学习 NumPy(数组运算)、Pandas(数据处理)、Matplotlib(可视化)三件套。不需要学 Web 开发或系统编程,但要非常熟悉 Jupyter Notebook 的使用。推荐在 Kaggle 上边做项目边学。B 站莫烦 Python 系列也是很好的中文入门资源。
PyTorch 和 TensorFlow 该选哪个?
2025-2026 年 PyTorch 占据绝对主导地位,尤其在学术研究领域。PyTorch 的动态图机制更直观,调试更方便,社区生态更活跃。如果你是初学者或做研究,强烈推荐 PyTorch。TensorFlow 在移动端部署(TFLite)方面仍有优势。两者核心概念相通,学会一个另一个很快上手。
没有 GPU 怎么训练模型?
多种免费方案可选:Google Colab 提供免费 GPU(T4),足以完成大部分学习实验;Kaggle Notebooks 提供免费 GPU(每周 30 小时);Hugging Face Spaces 可部署简单 ML 应用。国内用户还可以用百度 AI Studio(免费 V100)。对于大模型训练,AutoDL、Vast.ai 等按需付费平台性价比很高。
如何快速跟上 AI 领域最新进展?
推荐高效信息源:关注 arXiv 的 cs.AI 和 cs.CL 分类;订阅 The Batch(Andrew Ng 周报);中文用户关注机器之心、量子位公众号;浏览 Papers With Code 查看排行榜;在 X/Twitter 关注 AI 研究者;B 站关注 3Blue1Brown、李宏毅等优质 UP 主;加入 Reddit r/MachineLearning 社区。
非计算机专业能转行做 AI 吗?
完全可以。AI 领域有很多非 CS 背景的优秀研究者——物理学家擅长建模、生物学家推动了 AI for Science、经济学家对因果推理有独到见解。关键是:(1) 补上编程和数学基础;(2) 找到 AI 与你原专业的交叉点;(3) 通过项目积累实战经验。很多公司更看重实际能力而非学历背景。
LLM 时代,传统 ML 还值得学吗?
绝对值得。LLM 不是万能的——表格数据用 XGBoost 通常比 LLM 效果好且成本极低;推荐系统、时间序列预测、异常检测等场景仍然依赖传统 ML。更重要的是,理解过拟合、交叉验证、特征工程等基础概念是理解深度学习的前提。不学走就学跑,基础不牢容易走弯路。
学 AI 多久能找到工作?
因人而异,但一个参考路径:系统学习 4-6 个月(数学/编程基础 + ML/DL 课程)+ 2-3 个月实战项目(Kaggle 竞赛或个人项目)+ 1-2 个月求职准备。总计约 8-12 个月。关键是要有可展示的项目成果:完整的 GitHub 仓库、Kaggle 奖牌、技术博客、或者已上线的 AI 应用。算法岗竞争激烈,LLM 应用开发岗位需求正在快速增长。
中国 AI 团队和公司有哪些值得关注?
研究机构方面:清华、北大、上交、中科院等高校研究组;企业方面:DeepSeek(大模型推理)、百度(文心一言/Apollo 自动驾驶)、阿里(通义千问/达摩院)、字节(豆包/即梦)、腾讯(混元)、商汤、旷视、智谱 AI(GLM 系列)等。开源社区方面:ModelScope(魔搭社区)是国内版 Hugging Face。
AI Agent 是什么?值得现在学吗?
AI Agent 是能自主规划、决策并执行复杂任务的 AI 系统,结合了 LLM 推理能力、工具调用(搜索/代码执行/API)、记忆系统。2025 年被称为"Agent 元年",代表性项目包括 LangChain、AutoGPT、Claude Computer Use 等。如果你已有 LLM 基础,非常建议学习 Agent 开发——这是目前 AI 应用落地最热门的方向之一。