AI 基础知识(第 1 节深度讲解)
目录
1. AI 基础知识
人工智能(Artificial Intelligence, AI)是让机器具备类似人类智能的能力,使其能够进行理解、推理、学习、表达和决策。AI 已广泛应用于互联网、金融、医疗、工业、交通等各个领域,成为现代科技的核心驱动力之一。
本章将帮助你建立对 AI 的整体认知,包括:AI 的定义、发展脉络、与机器学习的关系,以及典型应用领域。
1.1 人工智能的定义与发展
✨ 1.1.1 人工智能定义(通俗理解)
人工智能是让计算机系统通过算法、数学模型与计算资源,模拟人类智能行为的技术。其目标包括:
- 感知能力:看(图像理解)、听(语音识别)、读(文本处理)。
- 理解能力:理解语义、识别意图、抽取信息。
- 推理能力:根据已有信息推断未知结果。
- 学习能力:从数据或反馈中持续改进。
- 决策能力:在多种可能中选择最佳方案。
- 交互能力:通过语言与用户自然沟通。
一句话总结:
AI = 模型 + 数据 + 算力,使机器能够模拟甚至扩展人类智能。
✨ 1.1.2 人工智能的发展历程(关键里程碑)
人工智能的发展可以分为以下几个阶段,每个阶段都有代表性的事件和技术突破。
📌 1950 - 1970:AI 萌芽阶段(符号主义 / 专家系统雏形)
- 图灵提出“图灵测试”(1950),判定机器是否具有人类智能。
- 初代智能程序诞生,如逻辑推理程序、下棋程序。
- 思路以“规则逻辑”为主,依靠人工定义规则。
特点:可解释性强,但难以扩展,知识更新成本高。
📌 1980 - 2000:机器学习兴起(统计学习时代)
- 数据驱动的学习方法出现,系统不再依赖手工规则。
- 代表技术:
- 神经网络(BP 算法)
- 支持向量机(SVM)
- 决策树与随机森林
- 开始应用到垃圾邮件识别、信用评分、搜索排序等场景。
特点:可从数据中自动提取模式,是现代 AI 的重要基础。
📌 2000 - 2010:大数据时代,深度学习积累能量
- 互联网产生海量数据。
- GPU 普及,让神经网络训练速度提升数百倍。
- Hinton 团队等在语音识别、图像预训练等方向持续探索,为后续突破奠定基础。
特点:为后续深度学习爆发积累数据、算力与算法准备。
📌 2010 - 至今:深度学习全面爆发,AI 加速落地
- 深度学习成为主流技术路线。
- Transformer 架构出现(2017) → LLM 时代开启。
- AI 应用遍地开花:
- 自动驾驶
- 语音助手(Siri、Alexa、讯飞)
- 智能推荐(抖音、YouTube)
- AIGC 生成式 AI(ChatGPT、Stable Diffusion)
- 2012 年 ImageNet 竞赛中的 AlexNet 让深度学习真正走上历史舞台,随后语音、视觉、NLP 全面突破。
特点:AI 已从学术探索进入大规模商业化阶段。
1.2 AI 与机器学习的关系
人工智能是一个大领域,机器学习和深度学习都是其中的一部分。
✨ 1.2.1 三者的层级关系
你可以将三者看成"包含关系":
✨ 1.2.2 人工智能(AI)
- 是最广义的概念。
- 包含所有让机器具备“智能”的方法。
- 包括:规则系统、知识图谱、搜索算法、机器学习、深度学习等。
AI = 模拟智能的所有技术集合
✨ 1.2.3 机器学习(ML)
- 机器学习是 AI 的一个子集。
- 核心思想:
让机器基于数据自动学习规律,而不是手工写规则。
常见任务:
- 分类(如垃圾邮件识别)
- 回归(房价预测)
- 聚类(客户分群)
- 推荐(个性化推荐)
- 时序预测(销量预测)
常见算法:
- 线性回归
- SVM
- 决策树 / 随机森林
- XGBoost
✨ 1.2.4 深度学习(DL)
- 深度学习是机器学习的一个分支。
- 基于“多层神经网络”,擅长处理复杂数据:
- 图像
- 语音
- 文本
- 视频
具有强大的表示能力,适合大规模数据任务,如:
- 图像识别(猫狗分类、自动驾驶)
- 语音识别(ASR)
- 自然语言生成(聊天模型)
- 多模态理解(图文匹配)
✨ 1.2.5 总结一下三者的区别
| 概念 | 范围 | 技术特点 |
|---|---|---|
| AI | 最大概念 | 模拟人类智能的一切技术 |
| ML | AI 的子集 | 从数据中“学习规律” |
| DL | ML 的子集 | 使用深层神经网络,高性能但资源要求高 |
一句话总结:
AI 是目标,ML 是方法,DL 是当下最强大的 ML 方法。
1.3 AI 的应用领域
人工智能已经深度融入我们日常生活和工作中的各个环节。
✨ 1.3.1 自然语言处理(NLP)
AI 能理解与生成自然语言,用于:
- 文本分类(垃圾邮件识别)
- 情感分析(评论是好评还是差评)
- 机器翻译(中英互译)
- 信息抽取(从合同中提取金额等关键信息)
- 语义搜索(理解你的问题意图)
- 对话系统(ChatGPT、Siri、客服机器人)
身边例子:
- 微信输入法词语联想
- 百度/谷歌搜索答案摘要
- 外卖客服机器人
- ChatGPT 对话
✨ 1.3.2 计算机视觉(CV)
让机器能“看懂”图像和视频:
常见任务:
- 图像分类
- 目标检测(识别人/车/物体)
- 人脸识别
- 图像分割
- 医学影像辅助诊断
- 视频理解(行为分析)
应用例子:
- 人脸解锁
- 相册自动分类
- 交通摄像头识别车辆与违章
- 医院用 AI 看 CT/MRI
✨ 1.3.3 语音识别与合成
AI 能听懂人说话,也能合成自然语音。
- 语音识别(ASR):会议记录、语音输入法
- 语音合成(TTS):导航语音、智能助手
- 声纹识别:识别“这是谁”
应用例子:
- Siri / 小爱 / 小度
- 智能车语音控制
- 会议实时转写
✨ 1.3.4 推荐系统
AI 根据用户行为推荐内容,是互联网产品的核心技术。
- 内容推荐(抖音、YouTube)
- 商品推荐(淘宝、亚马逊)
- 新闻推荐(今日头条)
- 视频/音乐推荐(Netflix、Spotify)
核心思想:
分析用户行为 → 预测兴趣 → 个性化推荐。
✨ 1.3.5 自动驾驶
自动驾驶是 AI 最复杂的应用之一,需要结合:
- 计算机视觉(识别人车路)
- 传感器融合(激光雷达 + 摄像头)
- 路径规划(决定怎么走)
- 控制算法(执行转向/刹车)
- 深度学习(理解环境)
特斯拉、百度 Apollo、Waymo都是代表性公司。
🎯 本章总结
- AI 是一个巨大的领域,目标是让机器模拟人类智能。
- ML 是 AI 的重要方法,而 DL 是 ML 的最强分支。
- 过去几十年,AI 从规则系统 → 机器学习 → 深度学习 → 大模型不断进化。
- AI 已经在 NLP、CV、语音、推荐、自动驾驶等领域大量落地。