AI
刷新
DeepSeek-R1源码解读

最近和开发者做了很多DeepSeek-R1模型相关的推理项目,这两天抽时间把hugging face上面的源码拉下来仔细看了一遍,在这里做一个分享。主要是解析MOE部分的代码,包括EP并行的代码实现。 整体结构 查看hugging face上面的modeling_deepseek.py文件和conf ...

大模型VS小模型:论国产数据库运维AI Agent的正确打开方式

博主头像 作者:孙鹏,大衍(北京)科技有限公司研发工程师 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 暴论:通用满血大模型“不适合”用于赋能国产数据库智能诊断运维 在传统数据库运 ...

【前端AI实践】DeepSeek:开源大模型的使用让开发过程不再抓头发

博主头像 有时候你可能正对着屏幕发呆,不知道怎么下手一个 Vue 的流式请求功能。这时候,DeepSeek 就像是你的“编程外挂”,帮你把模糊的需求变成清晰的代码。 下面我们就以几个常见的开发场景为例,看看 DeepSeek 能帮我们做点啥。 解答技术问题:SSE 流式请求怎么写? 假设你正在开发一个 AI ...

基于Trae编写文章实践

博主头像 自动补全编写段落# 实习生教学编程## AI编程 在过去,实习生们需要花费大量时间和精力来完成编程任务,这不仅浪费了他们的时间,也给他们的工作带来了压力。为了解决这个问题,我们开发了一个名为“AI编程”的工具,它可以帮助实习生们更高效地完成编程任务。我们先指导实习生们编写代码,然后再使用AI编程工具 ...

基于DeepSeek V3实现前端HTML5转换Vue.js工程实践

博主头像 背景以下是基于DeepSeek v3 0324版本实现前端HTML5转换Vue.js工程实践使用 Trae IDE编辑,之前Html是基于Readdy.ai生成,原始输入是UI设计图结论 我们基于Trae成功转换html到Vue.js工程。更多意义是:一、技术架构升级价值组件化开发范式跃迁Vue.j ...

不写代码,让 AI 生成手机 APP!保姆级教程

博主头像 你现在看到的 APP,是我完全用 AI 生成的,一行代码都没写!怎么做到的呢? 大家好,我是程序员鱼皮。AI 发展很快,现在随随便便就能生成一个网站,但是怎么纯用 AI 开发能在手机上运行的 APP 呢?网上基本上没有完整的教程。所以,我出手了,下面只用几分钟的时间,我会教大家如何利用 AI 生成 ...

如何分辨大模型的好坏?

博主头像 分辨大模型的好坏是一个多维度的问题,需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法: 一、核心能力维度 1、基础能力: 语言理解与生成: 流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息? 知识覆盖与准确性: 知识广度(涵盖多少领域? ...

AI 聊天应用的 10 条高级需求

博主头像 最新动态 GitHub 开源: https://github.com/experdot/pointer [MIT] 在深度使用了一段时间 Web 端和桌面端的 LLM 聊天工具后,我发现它们的用户体验普遍还有很大的提升空间。 下面是我总结的 10 个核心改进点。 1. 全局检索(Global Sea ...

人人都能“Aha” - 详解 DeepSeek 的“顿悟现象”

博主头像 作者:SpaderMan 在人工智能训练过程中,模型能力的跃迁往往并非线性提升,而是伴随着潜移默化的积累与突现的顿悟。本文以小模型为例,尝试通过强化学习探索 DeepSeek R1 中“顿悟现象”的再现与分析,揭示智能系统从量变到质变的过程。 实践目的 我们实践的目标包括: 探索语言模型在强化学习中 ...

华为Ascend 910B部署Qwen2.5-VL-32B方案

博主头像 华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 ...

规则学习:让机器学习像人类一样思考的可解释之路

博主头像 在机器学习领域,规则学习是一颗独特的明珠--它不像深度学习那样神秘,而是用人类可读的"如果-那么"规则来做出决策。 想象一下医生通过一系列症状判断疾病,或者风控系统根据用户行为拒绝贷款,规则学习的魅力正在于这种透明可解释性。 1. 基本概念 规则学习的目标是从数据中提取出一系列的规则,这些规则能够帮 ...

AI大模型入门知识

博主头像 这段时间各种AI名词一波接一波的冲击着我的屏幕,Agent,MCP,FunctionCalling,RAG,它们都是什么东西 有人说Agent是智能体,那智能体又是什么呢? 有人说MCP是AI时代的USB协议,那么它可以接U盘吗? 它们到底都是什么意思? Prompt 2023年,OpenAI则刚发 ...

<1···303132···50>