目录

AI 基础知识(第 1 节深度讲解)

1. AI 基础知识

人工智能(Artificial Intelligence, AI)是让机器具备类似人类智能的能力,使其能够进行理解、推理、学习、表达和决策。AI 已广泛应用于互联网、金融、医疗、工业、交通等各个领域,成为现代科技的核心驱动力之一。

本章将帮助你建立对 AI 的整体认知,包括:AI 的定义、发展脉络、与机器学习的关系,以及典型应用领域。


1.1 人工智能的定义与发展

✨ 1.1.1 人工智能定义(通俗理解)

人工智能是让计算机系统通过算法、数学模型与计算资源,模拟人类智能行为的技术。其目标包括:

  • 感知能力:看(图像理解)、听(语音识别)、读(文本处理)。
  • 理解能力:理解语义、识别意图、抽取信息。
  • 推理能力:根据已有信息推断未知结果。
  • 学习能力:从数据或反馈中持续改进。
  • 决策能力:在多种可能中选择最佳方案。
  • 交互能力:通过语言与用户自然沟通。

一句话总结:

AI = 模型 + 数据 + 算力,使机器能够模拟甚至扩展人类智能。


✨ 1.1.2 人工智能的发展历程(关键里程碑)

人工智能的发展可以分为以下几个阶段,每个阶段都有代表性的事件和技术突破。

📌 1950 - 1970:AI 萌芽阶段(符号主义 / 专家系统雏形)

  • 图灵提出“图灵测试”(1950),判定机器是否具有人类智能。
  • 初代智能程序诞生,如逻辑推理程序、下棋程序。
  • 思路以“规则逻辑”为主,依靠人工定义规则。

特点:可解释性强,但难以扩展,知识更新成本高。


📌 1980 - 2000:机器学习兴起(统计学习时代)

  • 数据驱动的学习方法出现,系统不再依赖手工规则。
  • 代表技术:
    • 神经网络(BP 算法)
    • 支持向量机(SVM)
    • 决策树与随机森林
  • 开始应用到垃圾邮件识别、信用评分、搜索排序等场景。

特点:可从数据中自动提取模式,是现代 AI 的重要基础。


📌 2000 - 2010:大数据时代,深度学习积累能量

  • 互联网产生海量数据。
  • GPU 普及,让神经网络训练速度提升数百倍。
  • Hinton 团队等在语音识别、图像预训练等方向持续探索,为后续突破奠定基础。

特点:为后续深度学习爆发积累数据、算力与算法准备。


📌 2010 - 至今:深度学习全面爆发,AI 加速落地

  • 深度学习成为主流技术路线。
  • Transformer 架构出现(2017) → LLM 时代开启。
  • AI 应用遍地开花:
    • 自动驾驶
    • 语音助手(Siri、Alexa、讯飞)
    • 智能推荐(抖音、YouTube)
    • AIGC 生成式 AI(ChatGPT、Stable Diffusion)
  • 2012 年 ImageNet 竞赛中的 AlexNet 让深度学习真正走上历史舞台,随后语音、视觉、NLP 全面突破。

特点:AI 已从学术探索进入大规模商业化阶段。


1.2 AI 与机器学习的关系

人工智能是一个大领域,机器学习和深度学习都是其中的一部分。

✨ 1.2.1 三者的层级关系

你可以将三者看成"包含关系":


✨ 1.2.2 人工智能(AI)

  • 是最广义的概念。
  • 包含所有让机器具备“智能”的方法。
  • 包括:规则系统、知识图谱、搜索算法、机器学习、深度学习等。

AI = 模拟智能的所有技术集合


✨ 1.2.3 机器学习(ML)

  • 机器学习是 AI 的一个子集。
  • 核心思想:

让机器基于数据自动学习规律,而不是手工写规则。

常见任务:

  • 分类(如垃圾邮件识别)
  • 回归(房价预测)
  • 聚类(客户分群)
  • 推荐(个性化推荐)
  • 时序预测(销量预测)

常见算法:

  • 线性回归
  • SVM
  • 决策树 / 随机森林
  • XGBoost

✨ 1.2.4 深度学习(DL)

  • 深度学习是机器学习的一个分支。
  • 基于“多层神经网络”,擅长处理复杂数据:
    • 图像
    • 语音
    • 文本
    • 视频

具有强大的表示能力,适合大规模数据任务,如:

  • 图像识别(猫狗分类、自动驾驶)
  • 语音识别(ASR)
  • 自然语言生成(聊天模型)
  • 多模态理解(图文匹配)

✨ 1.2.5 总结一下三者的区别

概念 范围 技术特点
AI 最大概念 模拟人类智能的一切技术
ML AI 的子集 从数据中“学习规律”
DL ML 的子集 使用深层神经网络,高性能但资源要求高

一句话总结:

AI 是目标,ML 是方法,DL 是当下最强大的 ML 方法。


1.3 AI 的应用领域

人工智能已经深度融入我们日常生活和工作中的各个环节。

✨ 1.3.1 自然语言处理(NLP)

AI 能理解与生成自然语言,用于:

  • 文本分类(垃圾邮件识别)
  • 情感分析(评论是好评还是差评)
  • 机器翻译(中英互译)
  • 信息抽取(从合同中提取金额等关键信息)
  • 语义搜索(理解你的问题意图)
  • 对话系统(ChatGPT、Siri、客服机器人)

身边例子

  • 微信输入法词语联想
  • 百度/谷歌搜索答案摘要
  • 外卖客服机器人
  • ChatGPT 对话

✨ 1.3.2 计算机视觉(CV)

让机器能“看懂”图像和视频:

常见任务:

  • 图像分类
  • 目标检测(识别人/车/物体)
  • 人脸识别
  • 图像分割
  • 医学影像辅助诊断
  • 视频理解(行为分析)

应用例子

  • 人脸解锁
  • 相册自动分类
  • 交通摄像头识别车辆与违章
  • 医院用 AI 看 CT/MRI

✨ 1.3.3 语音识别与合成

AI 能听懂人说话,也能合成自然语音。

  • 语音识别(ASR):会议记录、语音输入法
  • 语音合成(TTS):导航语音、智能助手
  • 声纹识别:识别“这是谁”

应用例子

  • Siri / 小爱 / 小度
  • 智能车语音控制
  • 会议实时转写

✨ 1.3.4 推荐系统

AI 根据用户行为推荐内容,是互联网产品的核心技术。

  • 内容推荐(抖音、YouTube)
  • 商品推荐(淘宝、亚马逊)
  • 新闻推荐(今日头条)
  • 视频/音乐推荐(Netflix、Spotify)

核心思想:

分析用户行为 → 预测兴趣 → 个性化推荐。


✨ 1.3.5 自动驾驶

自动驾驶是 AI 最复杂的应用之一,需要结合:

  • 计算机视觉(识别人车路)
  • 传感器融合(激光雷达 + 摄像头)
  • 路径规划(决定怎么走)
  • 控制算法(执行转向/刹车)
  • 深度学习(理解环境)

特斯拉、百度 Apollo、Waymo都是代表性公司。


🎯 本章总结

  • AI 是一个巨大的领域,目标是让机器模拟人类智能。
  • ML 是 AI 的重要方法,而 DL 是 ML 的最强分支。
  • 过去几十年,AI 从规则系统 → 机器学习 → 深度学习 → 大模型不断进化。
  • AI 已经在 NLP、CV、语音、推荐、自动驾驶等领域大量落地。