Ai入门
Ai入门
今天开始ai,以SpringAI为主,最近有AI的机会了。
我的文章按照what why how三个解释当然一开始先理解概念
核心概念
大模型LLM
大模型LLM 是 AI 的大脑,是指具有海量参数的人工智能模型,通过大规模的预训练获得广泛的知识和能力。
不同的大模型参数规模,处理能力,接受的对话长度是不一样的。
选择大模型后,可以设置参数调整大模型的输出,比如 温度可以控制模型输出的随机性,加温度越高,越多样、。
提示词 Prompt
用来引导模型声测会给你特定内容或者执行特定任务。提示词的质量直接决定了AI输出的准确度。
提示词又分为系统提示词和用户提示词
系统提示词是整体约束A输出的内容,一般需要提前设置。
用户提示词则是用户自主输入的内容。
Token
是与语言模型处理文本的基本单位,可能是单词或者标点符号。
模型蒸馏
大模型因为资源需求高而难以部署。模型蒸馏就是将复杂大模型的知识转移到更小模型中,就可以保持模型性能的同时,减小模型体积,降低推理成本。
多模态
多模态大模型能够同事理解和处理多种类型的信息,比如文本、图像、音频和视频,实现图文转化或者视频等更智能的应用。
有些大模型还具备文档解析的能力,可以上传一个PDF文件作为 上下文信息,交给AI去总结。
消息不准确怎么办
RAG检索增强生成技术
开启知识库功能,背后是RAG检索增强生成技术,用来利用外部知识库给A补充知识。
然后创建知识库,上传知识文档。
然后要对文本切分,可以设置自己的分块规则。
Embedding嵌入技术
将文本,图像等数据转换为向量表示,并写入到向量数据库中。用户向A提问时,会将问题转换成向量,从知识库中检索和问题相关的信息,再将这些信息和问题一起输入给大模型进行处理。
至此,A应用就做完了,可以发布给别人用,也可以通过API接口,在自己的代码程序中通过网络请求来调用。
智能体
上面还是聊天助手,智能体是能够感知环境,进行推理,制定计划,做出决策并自主采取行动来实现目标的AI系统。
可以给智能体提供工具,比如网页搜索,嗲用数据库等等。
思维链
有些模型用思维连CoT:在处理复杂问题时候,模型直接给出答案,可能缺乏逻辑性和可解释性
ReAct
结合推理 Reason和Act 行动的 AI 开发范式,模型先思考问题,推理分析并提出行动计划,然后执行行动,再给予结果进一步推理。
智能体工作流
单一的智能体不能完成我们的人物,这时候我们通过智能体工作流,可以编排和规划,让智能体自由搭配功能,自动化实现各种复杂的任务。
MCP
Model Context Protocol 模型上下文协议,用于实现AI与外部工具或数据的标准化交互。
MCP服务,能让我们更方便的给A集成不同的工具和数据,增强A应用和功能。,首先安装MCP Agent策略,让智能体支持调用 MCP
然后去MCP大全网站找到我们需要的MCP服务,比如查询时间。
然后回到智能体工作流中,填写MCP服务地址,调用MCP的指令和查询条件等信息,AI就可以在需要的时候向MCP发送请求来完成数据了。
AI编程技巧
如何让ai生成的代码更准确
优化Prompt
比如明确AI的角色,提供具体的细节要求,拆解任务,提供示例等,或者手写Prompt给其他AI,然后生成更高质量结构化的需求文档,再给Cursor去生成网站。
完整的需求文档包括:
- 明确项目背景和目标
- 详细列出功能要求和技术栈
- 制定代码风格和架构模式
- 提供示例和参考资料
- 明确限制条件和边界场景
复杂项目的生成技巧
对于复杂的项目一步到位不现实,利用分布迭代的策略。
先利用Cursor的Agent模式 + 高级推理模型生成基础项目框架,暂时不管功能好不好用,确保能够运行项目即可。
划分模块和功能点,依次向A提问,逐步实现核心功能并验证是否可用。
在保证不影响功能的前提下,优化实现细节。
如果改了一个Bug,又来3个Bug怎么办
1、项目模块化,把一个项目分成多个小项目
2、限定修改范围。AI生成的代码没那么可控,经常改A功能,B功能顺带也改了。
只要在提示词里面限定修改范围即可。
3、抽象和复用。介入用两个布局一模一样的页面,这时候A可能就是纯复制粘贴。所以适当的告诉AI,请帮我抽象X页面,XX代码为可复用的组件。
4、版本控制。利用Git版本控制工具管理。
AI开发框架
重点掌握SpringAI 和 LangChain4J
里面提供了很多告诉提高开发A应用的效率,比如快速对接大模型,保存绘画上下文,对接向量数据库实现RAG等等。
AI集成
2种,调用A云服务,本地部署大模型。
主要掌握,如何通过AP介入云服务,如何使用A云服务创建智能体和参数,如何选择合适的云服务,如何更定成本更稳定的使用云服务。
本地部署大模型
使用Ollama工具,一键部署各种主流的开源模型。
AI领域业务
RAG知识库,多模态,MCP服务,ReAct智能体。
RAG知识库
利用RAG检索增强技术,将文本嵌入模型生成向量,存入向量数据库。当用户提问,系统在向量数据库检索相关向量数据,找到醉相思的文档片段,输给大模型处理。
主流的向量数据库 Milvus,和PGVector,文档的抽取、转换、加载、索引的构建、查询策略的优化等等。
多模态
想要开发多模态应用要学习模态转换技术,比如文本转语音,语音转文本,光学字符识别OCR。
这些都有现成的工具库或者云服务掌握调用方法就行。
MCP服务
MCP是模型上下文协议,可以理解为提供给AI的各种服务,A利用这些服务能够实现更强大的功能。
ReAct智能体
这是一种构建智能体的范式,目的是打造能够依靠推理结果自主采取行动的智能体。
他的开发过程会涉及到任务规划,工具调用,交互IO,异常处理等知识。尤其是工具调用,可以通过Function Call 或者 MC实现天气查询、文件读写、网页运行、信息检索,终端命令执行等功能。
AI工具链
最后就是可能会用到的平台和工具和类库了
低代码A开发平台 Dify
工具库
Apache Tika 文档解析器工具库
Playwright,用于模拟浏览器行为的工具库,需要运行网页抓取网页数据,自动化测试时都能排上用场。
JSON格式解析库 GSON和Kryo
HTML文档解析库jsoup
部署工具
Vervel 适合前端应用平台,免费提供可访问的域名
Sealos 云原生应用平台,支持K8S集群管理,为A应用提供容器化部署环境
Railway 让开发人员轻松部署Docker容器,无需操心服务器配置和运维。
AI 绘图
强烈建议使用 Cursor工具搭配Claude 4 大模型
文本绘图
1、Mermaid最流行的文本绘图工具
1 | 请用 Mermaid 语法帮我画一个用户登录流程图,包含以下步骤: |
1 | flowchart TD |
2、PlantUML 专业的UM绘图工具
特别擅长绘制UML图片,时序图和系统架构图。
1 | 请用 PlantUML 语法帮我画一个订单系统的类图,包含: |
还有 Flowchart 和Graphviz 等文本绘图工具。
网页绘图
1、原生网页绘图
1 | 请生成一个数据可视化大屏页面,展示电商平台的实时数据: |
1 | 你是一位专业的 UI 设计师,请生成一个移动端电商APP的完整原型图,要求: |
2、 SVG矢量图绘制
SVG是可以缩放的矢量图形,SVG可以无线缩放而不失真,非常适合绘制UI素材,Logo图标,图形插画,技术架构图,流程图等。
SVG本质上是XM格式的文本代码,可以直接嵌入到网页
1 | 请生成一个 SVG 格式的系统架构图,展示一个典型的三层架构: |
3、Canvas动态绘图
Canvas是H5中提供的画布元素,JS可以在上面绘制各种图形。Canvas是像素的,性能优秀
1 | 请用 HTML5 Canvas 创建一个商务风格的宣传海报: |
1 | 请用 HTML5 Canvas 创建一个网络性能监控仪表板: |
思维导图
通过AI直接生成XMind格式的思维导图代码,提示如下
1 | 请帮我生成一个关于"微服务架构设计"的思维导图,要求生成可以导入 XMind 软件的格式。 |
专业绘图工具
用的比较多的draw.io 先让AI生成draw.io格式的XM代码,然后导入进去进行二次编剧
Emoji绘图
利用emoji表情来绘制简单的图
AI绘图技巧
1、提供示例图让A模仿
2、截图标注,精准修改
3、配置专业的系统预设,可以设置项目级别的Rules规则,让A始终遵循你的绘图规范


