V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  maolon  ›  全部回复第 3 页 / 共 10 页
回复总数  182
1  2  3  4  5  6  7  8  9  10  
@dongcxcx #12 kimi k2 试下?
我的意思不是用前置 node 判断用户意图(意图识别在模型性能不够强的情况下非常容易出错),而是简单判断信息是否完整,相当于做一次前置过滤,将用户问题按标准化格式转写也是一种方法
@dongcxcx prompt 看着没啥问题,那一般这种问题解决方法就是
1. langgraph 做一个前置检查 node (在这个 node 里判断用户信息是否完整,不完整就直接去 respond node 向用户要信息)
2. 如果保险起见就再做一个后置检查,去读你的 messages 记录里的 function call 是否有成功调用 sku 查询
3. prompt 里加入详细的流程例子做引导
4. 如果效果还是不好,在前置 node 里做用户 query 标准化转写
5. 最后不要用 4o-mini ,性能太弱,不要用 dsv3 ,指令遵循不行,虽然以我的经验来看 4o 实际不适合 react 的场景,如果可能可以酌情使用更好的模型(带 thinking/混合 thinking 模式),不行就算了
你这最关键的用了哪个模型驱动都不说
每个 agent 对各种 prompt 的效果也不一致,
你怎么设计的 prompt 也要描述清楚,
最后才是这些框架 workflow 的问题
那我也有一个问题:入门一定要报班吗?不能够通过自己的兴趣学会么?
前端入门是很艰深难懂的东西靠网上这些资料自己学不会?还是报了班自己就不用花时间去研究了?还是现在的 ai 一对一问答不好使了?
我这里也放个暴论,一个网上成熟的入门学习路线 + ai 辅助教学,未来会比任何培训班都好使
大词汇发明家 Karpathy 的发明词汇(最新的是 context engineering ), 结果大家都跟风用,
然后如果完全按着字面意思来理解真的去 vibe 就会大呼上当,一个误导性极强的词汇
107 天前
回复了 terryso 创建的主题 Claude 重磅更新! Claude Code 引入大杀器 sub-agents
@Grin1024 我在想能不能把 roo 的那几个专家移植几个过去
@Abmcar 怎么说呢,当年有些程序员是可以在记事本上面写码,肉眼排语法错误,你说这算不算内功?
但是后来大家都用 ide 了,不管你语法记得牢不牢,api 记得好不好,内功强不强,一开语法高亮和补全,新手老手根本拉不开差距。
现在也是一样,在 ai 辅助下,对于开发来说,内功强不强根本拉不开差距
114 天前
回复了 qi1 创建的主题 程序员 Claude-code 是否真的可以投入生产
@Chuckle 我觉得现在还在早期阶段,至少市面上还没有一套完整的,业内公认的 agent 工作流出现(就是怎么理解任务背景,怎么拆解任务内容,怎么执行,和怎么用测试验证防止出现你提到的这种经典错误),不过前两天刚出的 aws 的 kiro 有点那么个意思了,搞不好今年底或者明年初这套流程就能定下来,定下来之后大家统一按照流程走和优化流程,估计复杂度高的业务也能拿下了
我觉得本来就不应该把大部分精力放在怎么写上面,
而且下一代开发可能一入行就是 ai 辅助代码的环境了,会不会写对他们来说可能真没这么重要
你不试一试 gemini 2.5 pro 和 o3/o4 mini high 还有 grok4?
你选的那几个做题都一般
ai 应用发展的最快的是程序员应用的原因只是因为程序不是一个 open ended question ,有明确的结果可以预期和判断,所以 1. 这个方便了基模训练和对齐的过程 2. 也方便基于基模的应用引入自己的工具进行增强,所以程序员应用的体验是最好的,发展也是最成熟的,而不是交互模式这种理由
@iorilu vibe coding 不是要你啥都不想,而是让你不要再关注怎么“写”这种没有意义的“术”的层面的东西,更多的解放你的思维关注你说的这些核心要点(产品,架构,用户体验,快速迭代),我一直觉得 karpathy 啥都好,就是取名取的太有误导性,取个 vibe 这个词好像啥都不用关注一样
我觉得主要问题是这种场景下,甲方并不是程序员或者项目经理,可以很清晰准确的表达他们的需求,也就是
1. 需求很模糊
然后之前的 text2img 模型又有一个很大的缺陷就是他们是靠关键词生成图像(“念咒语”)而不是语义化的理解需求,也就是
2. 自动化生成需要很精确的需求描述
最后就是现在模型依然有的局限,没办法很好的对图像内容进行准确的评估,所以
3. 自动化评估很难实现
这几个点不解决就是文里面说的,只能完成 80%,后面就得靠人工,迭代也带靠人工,估计真正接近 95%的全自动流程得等到现在的语义化 text2img 和 vllm 的能力再提高才能实现了
维护? 按 andrew ng 前些时候的演讲,他公司一个月内换了三次架构,有问题就重写重构,代价已经是历史上最低的时期了,而且以后还会更低
你这啥都谈了就是不谈输出速度,kimi 官方 api 的输出速度才 15 t/s 左右,拿来写码不嫌慢么,claude 4 再慢也有个 50 t/s 往上的速度,cc 切了谷歌模型更是能到 200+ t/s 以上的速度
因为除非你的技术真的有 ip ,不然不管是套免费资料来卖,还是 ai 套壳,还是割韭菜,和你的“自研”东西比起来对用户来说都是没有区别的,你的产品能不能成功取决你最后的推广和营销(或者说人脉)。
就比如我们在做的东西,不说几十家吧,至少也有上百家在做同样的事情,但是我们谈到了跟谷歌的合作机会,甚至他们会帮我们做一些推广( podcast ),这些根本就跟我们的技术没有半毛钱关系
121 天前
回复了 jqknono 创建的主题 程序员 使用 Claude Code 中转商的风险
@randomSplash 我们是人都在同一个城市,直接同一个账号登陆,暂时没事,不如说还巴不得他封,封完全额退款
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2688 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 08:29 · PVG 16:29 · LAX 00:29 · JFK 03:29
♥ Do have faith in what you're doing.