AI编程初体验:用Windsurf零代码开发网页对话与图像理解插件

近年来,AI编程工具逐渐成为开发者的得力助手。继Cursor之后,新晋AI编程工具Windsurf凭借其强大的功能迅速走红。由估值12.5亿美元的美国初创公司Codeium打造,Windsurf将协作型智能体(Copilots)与独立智能体(Agents)相结合,成为当前最智能的AI代码生成工具之一。

Codeium vs GitHub Copilot

项目目标:开发Chrome浏览器插件

本文将带您使用Windsurf开发一款Chrome浏览器插件,支持网页对话和图像理解功能。我们将利用智谱AI提供的两款免费多模态模型API:GLM-4-Flash和GLM-4V-Flash。

插件功能示例

GLM-4-Flash:高效智能的多模态模型

GLM-4-Flash是一款兼具高速度和经济性的模型,适用于简单垂直、低成本且需要快速响应的任务。其功能包括:

  • 多轮对话:支持长达128K上下文的推理。
  • 网页浏览:能够自动解析网页内容。
  • Function Call:支持调用外部函数。
  • 多语言支持:涵盖中文、英语、日语、韩语、德语等26种语言。

GLM-4-Flash功能展示

应用场景

  • 数据抽取:生物学家用于处理分子数据,破解健康密码。
  • 数据生成:生成训练其他大模型的数据内容。
  • AI助教:高校学者用于制作虚拟学习伙伴。
  • 英语翻译:开发者用于构建互动性学习APP。
  • 内容生成:广告公司用于快速输出文案。

GLM-4V-Flash:强大的图像理解模型

GLM-4V-Flash是一款专注于图像处理的模型,支持图像描述生成、分类、视觉推理、视觉问答(VQA)以及情感分析等功能。同样支持26种语言。

GLM-4V-Flash功能展示

应用场景

  • 社交媒体文案生成:根据图片内容创作引人入胜的文案。
  • 教育辅助:通过图像识别和物理学知识帮助学生构建学习框架。
  • 美容咨询:识别皮肤问题并提供护肤建议。
  • OCR信息提取:高效提取保险单据中的关键信息。

开发步骤

  1. 下载Windsurf:确保安装最新版本,并购买会员以解锁全部功能。
  2. 创建项目文件夹:确保文件夹路径不含中文或特殊字符。
  3. 使用Windsurf打开文件夹:通过对话模式完善需求点并搭建项目框架。

Windsurf界面

  1. 加载Chrome插件:在Google浏览器的扩展程序中加载开发完成的插件。

插件加载

  1. 调试功能:分别测试GLM-4-Flash的对话能力和GLM-4V-Flash的图像理解能力。

功能调试

  1. 提交Chrome应用商店:完成开发后,提交插件至Chrome应用商店审核。

提交审核

结语

通过Windsurf,即使没有编程基础,也可以轻松完成一款功能丰富的Chrome浏览器插件。AI时代已经来临,不妨尝试从0到1开发属于你的插件。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年4月5日
下一篇 2025年4月5日

热门推荐