Ai入门

今天开始ai，以SpringAI为主，最近有AI的机会了。

我的文章按照what why how三个解释当然一开始先理解概念

核心概念

大模型LLM

大模型LLM 是 AI 的大脑，是指具有海量参数的人工智能模型，通过大规模的预训练获得广泛的知识和能力。

不同的大模型参数规模，处理能力，接受的对话长度是不一样的。

选择大模型后，可以设置参数调整大模型的输出，比如温度可以控制模型输出的随机性，加温度越高，越多样、。

提示词 Prompt

用来引导模型声测会给你特定内容或者执行特定任务。提示词的质量直接决定了AI输出的准确度。

提示词又分为系统提示词和用户提示词

系统提示词是整体约束A输出的内容，一般需要提前设置。

用户提示词则是用户自主输入的内容。

Token

是与语言模型处理文本的基本单位，可能是单词或者标点符号。

模型蒸馏

大模型因为资源需求高而难以部署。模型蒸馏就是将复杂大模型的知识转移到更小模型中，就可以保持模型性能的同时，减小模型体积，降低推理成本。

多模态

多模态大模型能够同事理解和处理多种类型的信息，比如文本、图像、音频和视频，实现图文转化或者视频等更智能的应用。

有些大模型还具备文档解析的能力，可以上传一个PDF文件作为 上下文信息，交给AI去总结。

消息不准确怎么办

RAG检索增强生成技术

开启知识库功能，背后是RAG检索增强生成技术，用来利用外部知识库给A补充知识。

然后创建知识库，上传知识文档。

然后要对文本切分，可以设置自己的分块规则。

Embedding嵌入技术

将文本，图像等数据转换为向量表示，并写入到向量数据库中。用户向A提问时，会将问题转换成向量，从知识库中检索和问题相关的信息，再将这些信息和问题一起输入给大模型进行处理。

至此，A应用就做完了，可以发布给别人用，也可以通过API接口，在自己的代码程序中通过网络请求来调用。

智能体

上面还是聊天助手，智能体是能够感知环境，进行推理，制定计划，做出决策并自主采取行动来实现目标的AI系统。

可以给智能体提供工具，比如网页搜索，嗲用数据库等等。

思维链

有些模型用思维连CoT：在处理复杂问题时候，模型直接给出答案，可能缺乏逻辑性和可解释性

ReAct

结合推理 Reason和Act 行动的 AI 开发范式，模型先思考问题，推理分析并提出行动计划，然后执行行动，再给予结果进一步推理。

智能体工作流

单一的智能体不能完成我们的人物，这时候我们通过智能体工作流，可以编排和规划，让智能体自由搭配功能，自动化实现各种复杂的任务。

MCP

Model Context Protocol 模型上下文协议，用于实现AI与外部工具或数据的标准化交互。

MCP服务，能让我们更方便的给A集成不同的工具和数据，增强A应用和功能。，首先安装MCP Agent策略，让智能体支持调用 MCP

然后去MCP大全网站找到我们需要的MCP服务，比如查询时间。

然后回到智能体工作流中，填写MCP服务地址，调用MCP的指令和查询条件等信息，AI就可以在需要的时候向MCP发送请求来完成数据了。

AI编程技巧

如何让ai生成的代码更准确

优化Prompt

比如明确AI的角色，提供具体的细节要求，拆解任务，提供示例等，或者手写Prompt给其他AI，然后生成更高质量结构化的需求文档，再给Cursor去生成网站。

完整的需求文档包括：

明确项目背景和目标
详细列出功能要求和技术栈
制定代码风格和架构模式
提供示例和参考资料
明确限制条件和边界场景

复杂项目的生成技巧

对于复杂的项目一步到位不现实，利用分布迭代的策略。

先利用Cursor的Agent模式 + 高级推理模型生成基础项目框架，暂时不管功能好不好用，确保能够运行项目即可。

划分模块和功能点，依次向A提问，逐步实现核心功能并验证是否可用。

在保证不影响功能的前提下，优化实现细节。

如果改了一个Bug，又来3个Bug怎么办

1、项目模块化，把一个项目分成多个小项目

2、限定修改范围。AI生成的代码没那么可控，经常改A功能，B功能顺带也改了。

只要在提示词里面限定修改范围即可。

3、抽象和复用。介入用两个布局一模一样的页面，这时候A可能就是纯复制粘贴。所以适当的告诉AI，请帮我抽象X页面，XX代码为可复用的组件。

4、版本控制。利用Git版本控制工具管理。

AI开发框架

重点掌握SpringAI 和 LangChain4J

里面提供了很多告诉提高开发A应用的效率，比如快速对接大模型，保存绘画上下文，对接向量数据库实现RAG等等。

AI集成

2种，调用A云服务，本地部署大模型。

主要掌握，如何通过AP介入云服务，如何使用A云服务创建智能体和参数，如何选择合适的云服务，如何更定成本更稳定的使用云服务。

本地部署大模型

使用Ollama工具，一键部署各种主流的开源模型。

AI领域业务

RAG知识库，多模态，MCP服务，ReAct智能体。

RAG知识库

利用RAG检索增强技术，将文本嵌入模型生成向量，存入向量数据库。当用户提问，系统在向量数据库检索相关向量数据，找到醉相思的文档片段，输给大模型处理。

主流的向量数据库 Milvus，和PGVector，文档的抽取、转换、加载、索引的构建、查询策略的优化等等。

多模态

想要开发多模态应用要学习模态转换技术，比如文本转语音，语音转文本，光学字符识别OCR。

这些都有现成的工具库或者云服务掌握调用方法就行。

MCP服务

MCP是模型上下文协议，可以理解为提供给AI的各种服务，A利用这些服务能够实现更强大的功能。

ReAct智能体

这是一种构建智能体的范式，目的是打造能够依靠推理结果自主采取行动的智能体。

他的开发过程会涉及到任务规划，工具调用，交互IO，异常处理等知识。尤其是工具调用，可以通过Function Call 或者 MC实现天气查询、文件读写、网页运行、信息检索，终端命令执行等功能。

AI工具链

最后就是可能会用到的平台和工具和类库了

低代码A开发平台 Dify

工具库

Apache Tika 文档解析器工具库

Playwright，用于模拟浏览器行为的工具库，需要运行网页抓取网页数据，自动化测试时都能排上用场。

JSON格式解析库 GSON和Kryo

HTML文档解析库jsoup

部署工具

Vervel 适合前端应用平台，免费提供可访问的域名

Sealos 云原生应用平台，支持K8S集群管理，为A应用提供容器化部署环境

Railway 让开发人员轻松部署Docker容器，无需操心服务器配置和运维。

AI 绘图

强烈建议使用 Cursor工具搭配Claude 4 大模型

文本绘图

1、Mermaid最流行的文本绘图工具

请用 Mermaid 语法帮我画一个用户登录流程图，包含以下步骤：
1. 用户输入账号密码
2. 前端校验格式
3. 发送请求到后端
4. 后端验证用户信息
5. 如果验证成功，生成 token 返回
6. 如果失败，返回错误信息
7. 前端根据结果跳转页面或显示错误

flowchart TD
    A[用户输入账号密码] --> B{前端格式校验}
    B -->|格式正确| C[发送登录请求到后端]
    B -->|格式错误| D[显示格式错误提示]
    C --> E{后端验证用户信息}
    E -->|验证成功| F[生成Token]
    F --> G[返回Token给前端]
    G --> H[前端保存Token]
    H --> I[跳转到主页]
    E -->|验证失败| J[返回错误信息]
    J --> K[前端显示错误提示]
    D --> A
    K --> A

2、PlantUML 专业的UM绘图工具

特别擅长绘制UML图片，时序图和系统架构图。

请用 PlantUML 语法帮我画一个订单系统的类图，包含：
- Order 类：订单ID、用户ID、总金额、状态、创建时间
- OrderItem 类：商品ID、数量、单价
- User 类：用户ID、用户名、邮箱
- Product 类：商品ID、名称、价格、库存
展示它们之间的关联关系

还有 Flowchart 和Graphviz 等文本绘图工具。

网页绘图

1、原生网页绘图

请生成一个数据可视化大屏页面，展示电商平台的实时数据：
1. 页面布局：深色背景的大屏风格，分为头部标题和多个数据展示区域
2. 包含以下图表：
   - 实时销售额（动态数字翻牌效果）
   - 各品类销售占比（饼图）
   - 24小时销售趋势（折线图）
   - 热销商品TOP10（柱状图）
   - 用户地域分布（中国地图热力图）
3. 使用 ECharts 实现，要有动画效果
4. 响应式布局，适配不同屏幕

你是一位专业的 UI 设计师，请生成一个移动端电商APP的完整原型图，要求：
1. 使用 HTML+CSS 实现，风格简洁现代
2. 在同一个 HTML 页面中生成所有的原型页面，平铺排列
3. 生成的原型图是可以直接提供给前端程序员进行开发的
4. 当你需要图片资源时，优先使用 SVG 格式的图片

2、 SVG矢量图绘制

SVG是可以缩放的矢量图形，SVG可以无线缩放而不失真，非常适合绘制UI素材，Logo图标，图形插画，技术架构图，流程图等。

SVG本质上是XM格式的文本代码，可以直接嵌入到网页

请生成一个 SVG 格式的系统架构图，展示一个典型的三层架构：
- 展示层：Web 前端、移动端 App
- 业务层：API 服务器集群（3个节点）
- 数据层：主从数据库、Redis 缓存
要求：
- 使用不同颜色区分各层
- 添加连接线表示数据流向
- 图形美观，配色专业

3、Canvas动态绘图

Canvas是H5中提供的画布元素，JS可以在上面绘制各种图形。Canvas是像素的，性能优秀

请用 HTML5 Canvas 创建一个商务风格的宣传海报：
- 主题：企业网络解决方案
- 布局：上下分层设计，上部分为图形区域，下部分为文字区域
- 核心图形：5个立体感服务器图标，用优雅的曲线连接
- 配色：蓝白配色方案，体现专业感
- 文字内容：公司 Logo、产品名称、核心卖点
- 视觉效果：微妙的阴影和高光，提升质感
- 输出格式：可打印的高分辨率海报

请用 HTML5 Canvas 创建一个网络性能监控仪表板：
- 设计元素：
  * 中央放置主要的网络拓扑图
  * 周围添加各种图表和数据指标
  * 实时数据流动效果
  * 状态指示灯和进度条
- 配色：深色主题配亮色高亮
- 文字：等宽字体，模拟代码风格
- 细节：添加网格背景和扫描线效果

思维导图

通过AI直接生成XMind格式的思维导图代码，提示如下

请帮我生成一个关于"微服务架构设计"的思维导图，要求生成可以导入 XMind 软件的格式。
注意，XMind 文件实际上是一个 ZIP 压缩包，需要包含多个必要的文件。

导图内容包含以下要点：
1. 服务拆分原则
   - 单一职责
   - 服务自治
   - 接口明确
2. 通信机制
   - 同步通信（REST、gRPC）
   - 异步通信（消息队列）
3. 服务治理
   - 服务注册与发现
   - 负载均衡
   - 熔断降级

专业绘图工具

用的比较多的draw.io 先让AI生成draw.io格式的XM代码，然后导入进去进行二次编剧

Emoji绘图

利用emoji表情来绘制简单的图

AI绘图技巧

1、提供示例图让A模仿

2、截图标注，精准修改

3、配置专业的系统预设，可以设置项目级别的Rules规则，让A始终遵循你的绘图规范