📖 AI基础概念

机器学习核心知识体系

🎯 AI研究领域

🧠
机器学习 ML

让机器从数据中自动学习规律,是AI的核心基础

核心
📝
自然语言处理 NLP

让机器理解和生成人类语言

文本
👁️
计算机视觉 CV

让机器"看懂"图像和视频

图像

🔄 机器学习三大类型

🎯 监督学习

有标准答案,学习输入→输出的映射

分类 回归
  • 垃圾邮件识别
  • 房价预测
  • 图像分类
🔍 无监督学习

无标签,发现数据内在结构

聚类 降维
  • 用户分群
  • 异常检测
🎮 强化学习

试错+奖励,不断优化策略

决策
  • 游戏AI
  • 机器人控制
📈
回归 vs 分类
监督学习的两大任务
对比 回归问题 分类问题
输出 连续数值(150.5、25.3) 离散类别(猫、狗、垃圾)
例子 预测房价、温度、销量 识别猫狗、垃圾邮件
指标 MSE、RMSE 准确率、精确率

🔄 ML工作流程

数据收集
数据清洗
特征工程
模型训练
模型评估
预测应用

🔧 算法分类速查

类别 典型算法 适用场景
回归 线性回归、岭回归 房价预测、销量预测
分类 逻辑回归、决策树、SVM 垃圾邮件、疾病诊断
集成 随机森林、XGBoost 竞赛、高精度预测
聚类 K-Means、DBSCAN 用户分群、异常检测
降维 PCA、t-SNE 可视化、特征压缩

📚 详细算法说明请参见 机器学习 页面

📝 NLP核心任务

📖 文本分类

情感分析、垃圾邮件检测

🔤 命名实体识别

提取人名、地名、机构名

📝 文本生成

机器翻译、摘要、对话

❓ 问答系统

阅读理解、知识问答

💬 对话系统

任务型、开放域聊天

👁️ CV核心任务

🖼️ 图像分类

ImageNet、人脸识别

🎯 目标检测

YOLO、人脸检测

🎨 语义分割

U-Net、自动驾驶

🖌️ 图像生成

GAN、Diffusion

🎮 强化学习核心概念

Agent-Environment交互
┌─────────────────────────────────────────────────────────────────┐ │ │ │ 智能体(Agent) ←── 奖励(Reward) ──→ 环境(Environment) │ │ │ │ │ │ │ 动作(Action) │ 状态(State) │ │ │ │ │ │ └───────────────────────────────────▶│ │ │ │ │ 核心要素:Agent、环境、状态、动作、奖励、策略 │ │ │ └─────────────────────────────────────────────────────────────────┘

💬 大语言模型 (LLM)

📚 预训练

海量文本学习语言知识

自监督学习

⚙️ 微调

任务特定数据优化

Fine-tuning

📝 提示工程

通过提示词引导输出

Zero-shot

📚 详细LLM内容请参见 大语言模型 页面

📚 深度学习详细架构请参见 深度学习 页面

🏢 AI行业应用

行业 典型应用
医疗影像诊断、药物发现、辅助手术
金融风控、反欺诈、智能客服、信用评估
零售个性化推荐、需求预测、智能定价
制造质量检测、预测性维护、机器人控制
交通自动驾驶、交通预测、智能调度
教育个性化学习、智能答疑、自适应测评

⚖️ AI伦理与安全

⚠️ 主要风险

  • 对抗攻击(输入扰动)
  • 隐私泄露(数据逆向)
  • 模型偏见(训练数据)
  • 深度伪造(虚假信息)

🛡️ 安全措施

  • 红队测试(安全评估)
  • 差分隐私(数据保护)
  • RLHF(人类反馈对齐)
  • 可解释性研究