- 博客(1837)
- 收藏
- 关注
原创 程序员转行AI大模型教程(非常详细),大模型入门到精通,存下吧很难找全的!
在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。了解机器学习、深度学习的基本概念和原理,掌握常见的算法和模型架构。
2025-10-21 18:44:40
650
原创 面试宝典 Transformer面试题全搞定
Transformer为何使用多头注意力机制?(为什么不使用一个头)Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?(注意和第一个问题的区别)Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?为什么在进行softmax之前需要对attention进行scaled(为什么除以dk的平方根),并使用公式推导进行讲解在计算attention score的时候如何对padding做mask操作?
2025-10-16 18:39:34
798
原创 【翻译】Attention Is All You Need
注意力是你所需要的一切主导的序列转导模型是基于复杂的递归或卷积神经网络,包括一个编码器和一个解码器。性能最好的模型还通过注意机制将编码器和解码器连接起来。我们提出了一个新的简单的网络结构–Transformer,它只基于注意力机制,完全不需要递归和卷积。在两个机器翻译任务上的实验表明,这些模型在质量上更胜一筹,同时也更容易并行化,需要的训练时间也大大减少。我们的模型在WMT 2014英德翻译任务中达到了28.4 BLEU,比现有的最佳结果(包括合集)提高了2 BLEU以上。
2025-10-16 18:37:56
674
原创 OpenAI重磅发布“KG+LLM”结合的企业智能知识管理
时序代理是一个管道组件,用于摄取原始数据并为知识图谱生成带时间戳的三元组。这可以实现精确的基于时间的查询、时间线构建、趋势分析等。3、管道如何工作?管道首先对原始文档进行语义分块。这些块被分解为为我们的 Temporal Agent 准备的语句,然后创建时间感知三元组。然后,失效代理可以执行时间有效性检查,发现并处理任何被图表上发生的新语句失效的语句。知识图谱上的多步骤检索。
2025-10-14 21:23:05
778
原创 告别传统RAG,用智能Agent方法构建 AI 知识库
问题:定期嵌入新数据、监控向量库性能都增加复杂度;向量可能泄露原文信息,需要防范embedding反推原文的风险。概括来说,传统RAG扩展了LLM知识却引入新的挑战——
2025-10-14 21:21:01
1236
原创 AI Agent案例实践:三种智能体开发模式详解之二(基于LangChain框架)
LangChain 是一个开源框架,主要用来 让大语言模型(LLM)能够更好地和外部世界交互,从而不只是“对话生成器”,而是变成可以调用工具、处理数据、接入知识库、执行任务的“智能体”。
2025-10-14 21:19:51
1145
原创 从零到一开发 Text-to-SQL MCP 数据查询服务器
我们开发的 Text-to-SQL MCP 服务器是一个基于 Model Context Protocol (MCP) 的安全数据库查询服务。该服务器允许通过自然语言生成 SQL 查询,并在严格的权限控制下执行查询操作,确保数据安全的同时提供便捷的数据访问能力。本文详细介绍了从零开始构建 Text-to-SQL MCP 服务器的完整过程,包括环境搭建、核心模块开发、安全机制实现和服务测试。通过 FastMCP 框架,我们快速构建了一个安全、可控的数据库查询服务,实现了自然语言到 SQL 的转换功能。
2025-10-13 18:36:06
539
原创 AI Agent竞争的下半场:决胜关键不在模型,而在系统架构
智能体系统不是一蹴而就的产品,而是一种“逐步演进的工程”。一开始你可以只做一个问答助手,但随着工具接入、状态管理、知识库丰富,它会慢慢成长为一个懂业务、会协作、能执行的智能体生态。未来的竞争,不在于谁接了哪个大模型,而在于谁能把“智能”更好地嵌入业务流程中。完善安全与审计机制—— 日志、权限、溯源,一个都不能少。这就是从“架构图”到“可落地系统”的完整路径。
2025-10-13 18:34:57
444
原创 大模型提示词技巧Prompt Engineering,看这一篇就够了
你在写prompt时候,是不是总觉得大模型它不听话。要么答非所问、要么一堆废话。扒开思考过程仔细阅读时而觉得它聪明绝顶,时而又觉得它愚蠢至极。明明已经对了怎么又推理到错的地方去了,明明在提示词中提醒过了不要这么思考它怎么就瞎想了。这也许就是每一个Prompt Engineer的困扰。怎么能让模型按照要求去思考。长提示词到底应该怎么写,有没有方法可以一次命中,找到那个终极的提示词。答案是否定的,一篇成功的长提示词总是要经历初始版本、调优、测试、再调优。不过这个过程中有规律可循,有方法可套。
2025-10-13 18:33:50
434
原创 从零到一开发 Text-to-SQL MCP 数据查询服务器
我们开发的 Text-to-SQL MCP 服务器是一个基于 Model Context Protocol (MCP) 的安全数据库查询服务。该服务器允许通过自然语言生成 SQL 查询,并在严格的权限控制下执行查询操作,确保数据安全的同时提供便捷的数据访问能力。本文详细介绍了从零开始构建 Text-to-SQL MCP 服务器的完整过程,包括环境搭建、核心模块开发、安全机制实现和服务测试。通过 FastMCP 框架,我们快速构建了一个安全、可控的数据库查询服务,实现了自然语言到 SQL 的转换功能。
2025-10-13 18:32:49
1032
原创 不藏了,有人用扣子(Coze)工作流,批量生成10万+治愈系老奶奶漫画图,成功起号,实现睡.后收入,每天公众号流量主收益相当可观。
同时课程详细介绍了。
2025-10-13 18:31:24
819
原创 飞算 JavaAI:大模型赋能Java开发,智能生成完整工程代码
在数字化浪潮中,Java 虽在金融、电信等关键领域占据主导地位,但开发领域面临诸多挑战。2024 年数据显示,全球 Java 开发者超 1500 万,可企业级项目开发效率陷入瓶颈,功能模块开发周期长,代码维护成本高。数字化转型加速,行业对企业软件需求迅猛增长,传统开发模式难满足。同时,Java 开发面临人才断层问题,顶级工程师培养周期长;企业级系统质量隐患突出,平均每千行代码缺陷率较高,且新产品上线周期慢会严重影响市场占有率。本文将介绍飞算 JavaAI 的相关功能及实践操作。飞算 JavaAI。
2025-10-11 17:44:29
743
原创 从零开始学大模型:AI Agent、MCP与RAG核心技术解析
AI Agent 是一个能够感知环境、基于自身目标进行决策,并采取行动以影响环境的软件实体。自主性:Agent 能够在没有外界直接干预的情况下,自主决定自身行为。例如,智能家居中的 AI Agent 可以根据室内温度、湿度以及用户的习惯,自主控制空调、加湿器等设备,无需用户手动操作。反应性:对环境变化迅速做出反应。在自动驾驶场景中,汽车上的 AI Agent 实时感知路况、其他车辆的行驶状态等环境信息,一旦检测到前方车辆突然刹车,能立即做出减速或避让的反应。前瞻性。
2025-10-11 17:43:04
1041
原创 AI、AGI、AIGC、AI Agent、RAG概念详解+大模型系统教程,小白入门必看
AI,即人工智能,作为计算机科学的重要分支,致力于模拟人类的智能行为,涵盖学习、推理、感知等多个方面,包含机器学习、自然语言处理、计算机视觉等多种技术。AGI,全称 Artificial General Intelligence,即通用人工智能,旨在打造具备跨领域学习与推理能力的智能系统,使其能够像人类一样灵活应对各种复杂未知的问题,自主学习新技能并设定目标。
2025-10-11 17:34:59
371
原创 一文搞懂MCP、RAG、Agent:AI三大核心技术详解,零基础也能秒变达人
最近的AI圈,完全被MCP、RAG、Agent这三个词“承包”了热度——不仅每天都有新的相关工具扎堆亮相,技术论坛里的深度讨论、行业群里的经验分享更是热度居高不下,几乎成了从业者和爱好者的“必聊话题”。但热闹背后,不少朋友一撞见这几个术语就犯怵:它们到底是AI领域里的“何方神圣”?实际能解决哪些问题?对咱们普通人的工作、生活又有啥实实在在的影响?别担心!
2025-10-11 17:34:05
1279
原创 关于什么是Agent、如何构建Agent,最近最值得读的文章
Agent”的定义多种多样。一些客户将 Agent 视为完全自主的系统,能够在长时间内独立运行,利用各种工具来完成复杂的任务。另一些客户则用这个词来描述遵循预定义工作流程、更具规范性的实现。在 Anthropic,我们将所有这些类型都归为agentic systems,但在架构上,我们会对。
2025-10-08 17:46:00
985
原创 企业级AI应用需要系统工程支撑,如何通过MCP大模型实现企业级AI应用
三桥君指出,MCP架构通过低耦合高弹性架构、AI生产力组合式落地、多模型接入与插件支持、全链路可观测性、安全合规稳定高效,实现了企业级AI应用的全链路实战解构。通过构建企业级智能助手、搭建多模型服务统一接入平台、推动AI与业务深度融合,MCP架构为企业级AI应用提供了强大的支持。希望能为你在企业级AI应用中提供有价值的参考和指导。
2025-10-08 17:43:38
856
原创 CLIP模型原理与代码实现详解:从原理到代码实现,助你入门大模型学习
目前,大模型十分活跃,openai公司呈现GPT系列,特别是Chat-GPT给人深刻印象,意识到大模型厉害之处,随后推出GPT4模型,更是将大模型进一步推到一个高度,并将多模态融合技术留下深刻印象,同时,学者也对多模态融合技术研究呈现百花齐放之势。然而,多模态模型大多以CLIP所提方法或思路实现多模态融合。为此,本文将重新回顾CLIP论文相关理论,也重点梳理其源码,并附其代码供读者参考(本文会涉及VIT与BERT代码解读)。
2025-10-08 17:41:31
1290
原创 飞算JavaAI炫技赛:电商系统商品管理模块设计与实现
在API-Post中配置好对应的API接口作为一名深耕Java领域多年的技术博主,这次参与飞算JavaAI炫技赛的电商系统开发让我收获颇丰。整个商品管理模块的开发过程充分展现了AI辅助开发与传统工程实践的完美结合。在架构设计阶段,我们采用了经典的"四层架构"模式:表现层(Controller)、业务层(Service)、数据访问层(Mapper)和存储层(MySQL+Redis+ES)。这种分层设计不仅使系统结构清晰,更便于团队协作开发。
2025-10-05 22:37:22
762
原创 AI 的提示词专栏:写对提示词,让 AI 懂你所想
人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库,把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。无论你是刚接触 AI 的新手,还是有一定基础想提升的人,都能在这里找到合适的内容。从最基础的工具操作方法,到背后深层的技术原理,专栏都有讲解,还搭配了实例教程和实战案例。这些内容能帮助学习者一步步搭建完整的 AI 知识体系,让大家快速从入门进步到精通,更好地应对学习和工作中遇到的 AI 相关问题。这个系列专栏能教会人们很多实用的 AI 技能。
2025-10-05 22:36:23
1197
原创 AI Ping:精准可靠的大模型服务性能评测平台
AI Ping作为一款面向开发者的大模型服务性能评测平台,凭借其科学严谨的评测方法、全面客观的评测数据、贴近用户需求的功能设计,已经成为开发者选择MaaS服务的得力助手。通过持续的性能监控和实时数据更新,AI Ping为开发者提供了一个透明、高效的服务评测工具,帮助他们在大模型技术的浪潮中做出明智的决策。服务行业的健康发展。AI Ping作为一款面向开发者的大模型服务性能评测平台,凭借其科学严谨的评测方法、全面客观的评测数据、贴近用户需求的功能设计,已经成为开发者选择MaaS服务的得力助手。
2025-10-05 22:33:22
976
原创 AI驱动开发实战:基于飞算JavaAI的在线考试系统设计与实践
在软件工程领域,我们正处在一个由人工智能驱动的深刻变革时代。AI不再仅仅是应用的功能,更逐渐成为缔造应用的强大工具。本文以飞算科技(CalEx Tech)举办的「飞算JavaAI炫技赛」为契机,完整记录了笔者如何选用“在线考试系统的设计与实现”这一课题,借助IntelliJ IDEA中的飞算JavaAI插件,从一句自然语言指令开始,历经AI驱动的需求分析、接口设计、数据库建模、全量代码生成,最终成功部署并上线一个功能完备的系统。
2025-10-05 22:32:38
606
原创 AGI大模型学习路线(非常详细)收藏这一篇就够了!
自学AI大模型需要扎实的基础知识、系统的学习路线和持续的实践与探索。希望这条学习路线能为新手小白们提供一个清晰的方向,帮助大家更好地进入和发展在AI大模型领域。祝大家学习顺利,早日成为AI领域的专家!。
2025-09-30 16:27:03
847
原创 大模型算法,入职两个月,不想干了
incontext learning,通过设计特定提示(零样本和少样本)来引导 LLM 的行为,比如构建聊天机器人。速度快,不需要训练,但是比起微调不太容易控制RAG,将大模型和外部知识检索结合,比如构建基于专有知识和动态数据集的机器人。内容可以动态更新,且减少模型幻觉,但是推理成本会增加,并且还需要外部知识库和数据库(比如向量数据库)
2025-09-26 18:33:16
924
原创 企业级大模型AI应用开发与落地指南
大模型应用从实验室到生产环境,是技术理性与工程智慧的融合之战。中腰部企业需借力专业AI中台,基于业务需求拆解模型能力边界,通过领域知识注入重塑AI认知逻辑,最终构建符合自身数据安全与性能要求的智能体系。要实现**效果-成本-速度铁三角、**数据-算法-工程铁三角,敏捷-稳定****推进企业大模型 AI 应用落地进程。这才是AI技术从"玩具"进化为"工具"的关键一跃。
2025-09-26 18:31:15
667
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人