最开始很喜欢Cursor的开发体验,感觉所见即所得:
- 可以非常快速的选中代码,然后扔给它解决;
- 也可以截图,然后交给它生成UI;
- 每一个步骤都可以反复修改,不用记命令,直接GUI上操作;
- ...
看着Cursor自动化操作,有一种赏心悦目的感觉。
不过,体验Claude Code之后,这些发生变化。
我不再纠结是否拥有GUI,只看重结果和推理过程中产出的东西是否有价值。
Claude Code做得很好,至少目前看来很强。
我主要做前端开发,经常需要与UI界面打交道,
如果AI不能自主识别UI,会给我造成非常大的困扰。
所以,普通的文本模型基本对我没啥用。
至少是,多模态模型,支持文本/图像/视频,并且还能推理和编程。
不得不说,开源大模型与商业模型还有差一段路。
绝大多数开源大模型仅仅是文本模型,或者是某种单一模型,只支持图像或视频,无法支持多模态工作。
零星有一些支持多模态的开源模型,性能较普通,根本不能用来工作生产。
并且,这些模型的部署条件,对硬件要求颇高,不是普通开发者能消费。
回到Claude Code这里来,这是目前验证过,能支持工作生产的AI工具。
Claude Code严格意义上说,是一个Agent。其背后的官方大模型有:
- claude-sonnet
- claude-opus
以上是经常用的,4.6/4.7都不错。绝大部分情况下优先使用sonnet,遇到复杂问题要么opus,要么自己思考。
Claude Code也支持其他厂商的模型,具体有什么要求,暂时不得而知。
总之,那些性能低、不具备多模态的模型,是不能接入到Claude Code。
...
先聊这么多,我再想想有什么可说的。