AI大模型开发学习路线图(2026版)
阶段1:AI大模型开发入门
私有化大模型部署
- 聊天机器人项目需求分析
- 大模型核心基础
- VMware
- Linux基础
基于Ollama+ChatBox实现智能聊天
- 私有大模型解决方案
- Ollama安装与使用
- Ollama客户端详解
- Ollama API 详解
- ChatBox与Ollama快速搭建聊天机器人
Python基础语法
- Python输入输出
- Python数据结构
- Python函数
- Python文件读写
- Python异常处理
- Python模块和包
聊天机器人项目实战
- Streamlit框架
- 基于Python调用本地大模型API实现聊天机器人
阶段2:大模型语言进阶
Python编程进阶
- 面向对象基础
- 闭包
- 装饰器
- 正则
- 数据结构算法时间复杂度
- 线性表、链表、二分查找
- 冒泡、选择、插入、快排
数据处理与统计分析
- Linux命令使用
- Linux命令选项的使用
- 数据库概念和作用
- MySQL数据库及表基本操作命令
- PyMySQL
Numpy矩阵运算库
- Numpy运算
- 数组的属性
- Numpy实现数组基本操作
- Numpy实现数组运算
- 矩阵乘法
Pandas数据处理
- 数据组合处理函数
- 缺失值处理函数
- Pandas数据类型
- Pandas数据分组
- Pandas透视表
- datetime数据类型
- Pandas数据可视化
能力画像 & 岗位 & 薪资
✅ 能力画像:掌握人工智能Python语言,掌握数据处理方法及数据统计分析方法,为数据建模奠定技术基础
✅ 胜任岗位:数据分析师、初级AI开发工程师、人工智能开发工程师
✅ 参考薪资:10-15k
阶段3:机器学习与深度学习
机器学习
- 机器学习开发流程
- 特征工程介绍和小结
- 机器学习算法分类
- 机器学习模型评估
- 数据分析与机器学习
- 聚类算法的概念
- 聚类算法实现原理
- 聚类算法的评估
- 聚类算法案例
- 分类算法的概念
- 分类算法实现原理
- 分类算法的评估
- 分类算法案例
深度学习
- 神经网络的构成
- 激活函数
- 损失函数
- 优化方法及正则化
- 反向传播原理:梯度下降算法、链式法则、反向传播算法、改善反向传播算法性能的迭代法
- 深度学习正则化与算法优化:L1、L2、Dropout、BN、SGD、RMSProp、Adagrad、Adam等
- 多层神经网络案例
- 深度学习多框架对比
Pytorch框架
- Pytorch介绍
- 张量概念
- 张量运算
- 反向传播
- 梯度
- 自动梯度
- 参数更新
- 数据加载器
- 迭代数据集
能力画像 & 岗位 & 薪资
✅ 能力画像:掌握机器学习与深度学习核心算法,能够解决基础人工智能问题
✅ 胜任岗位:机器学习工程师、深度学习工程师
✅ 参考薪资:20-25k
阶段4:NLP自然语言处理
NLP入门与文本预处理
- NLP简介
- NLU简介
- 文本生成简介
- 文本批量表示方法
- 文本张量表示方法
- 文本语料的数据分析
- 文本特征处理
- 数据增强方法、分词
- 词性标注
- 命名实体识别
- one-hot编码
- Word2vec
- Word Embedding
- 标签数量分布
- 句子长度分布
- 词频统计与关键词词云
RNN及变体
- 传统RNN
- LSTM
- BI-LSTM
- GRU/Bi-GRU
- 新闻分类场景
- 机器翻译场景
- Seq2Seq
Transformer原理
- Transformer结构
- softmax层
- 注意力机制
- 多头注意力机制
- 前馈全连接层
- 规范化层
- 子层连接结构
迁移学习
- Huggingface
- fasttext工具文本分类
- CBOW模式
- Skip-Gram模式
- 微调及微调脚本
- 训练词向量
- 模型调优
- n-gram特征
能力画像 & 岗位 & 薪资
✅ 能力画像:通过文本处理、分析和建模,实现NER、文本分类、文本摘要、聊天机器人等功能
✅ 胜任岗位:NLP算法工程师、知识图谱工程师、机器学习工程师、语音识别工程师
✅ 参考薪资:25-30k
阶段5:大模型核心技术
大模型入门
- 大模型基础知识
- 主流大模型分类
- AI应用工具集
- 大模型Prompt Engineering原理与实战
- 企业级大模型开发平台
大模型应用开发
- Function Call的原理及实战
- GPTs与Assistant API原理及应用
- MCP原理与代码实现
- 大模型Agent原理及实战
大模型微调开发
- 提示词工程实战
- 大模型平台应用实战【电商】
- 大模型知识库实战(RAG)
- 多领域大模型微调实战
大模型蒸馏
- 大模型蒸馏概述
- 蒸馏原理剖析
- 数学模型
- 蒸馏步骤详解
- 蒸馏实践操作
- 蒸馏效果评估与优化
- DeepSeek蒸馏Qwen-7B模型实战
企业级大模型平台开发
- 阿里百炼平台及PAI平台
- 讯飞星愿Mass微调平台
能力画像 & 岗位 & 薪资
✅ 能力画像:设计、实现与优化垂直领域大模型
✅ 胜任岗位:大模型开发工程师、Prompt工程师、大模型算法专家、大模型训练/推理开发工程师
✅ 参考薪资:25-35k
阶段6:多模态大模型
图像与视觉处理介绍
- 计算机视觉定义
- 计算机视觉技术和应用场景
- 计算机视觉知识树和几大任务
图像分析
- 图像的表示方法
- 图像的几何变换
- 颜色变换
- mixup
- copypaste
图像分类
- 分类的思想
- AlexNet
- InceptionNet
- ResNet
- 模型微调策略
图像分割
- 分割思想
- Unet
- FCN Net
- MaskRCNN
多模态大模型项目
- 图像生成算法GAN、VAE、Diffusion等
- Stable Diffusion算法剖析:Diffusion、latent diffusion、模型构建、模型训练、LoRA微调、dreambooth、图像生成效果
- 基于stable diffusion构建图像生成的小程序
能力画像 & 岗位 & 薪资
✅ 能力画像:通过图像和视频分析、物体识别等技术,实现机器视觉相关任务
✅ 胜任岗位:CV算法工程师、目标检测工程师、图像处理工程师、深度学习工程师
✅ 参考薪资:25-30k
阶段7:大厂面试专题
数据结构
- 栈
- 树
- 图
- 数组
- 链表
- 哈希表
常见算法
- 排序
- 查找
- 链表算法
- 动态规划贪心算法
机器学习/深度学习
- 分类算法面试题
- 回归算法面试题
- 聚类算法面试题
- 深度学习面试题
NLP/CV专题
- Transformer模型原理
- Bert/GPT面试题
大模型专题
- Prompt提示词
- LangChain大模型工具模型微调
- LoRA/Prefix-Tuning
- DeepSeek/QWen原理与面试题