CodeFuse是一款由蚂蚁集团自主研发的代码生成专属大模型,旨在根据开发者的输入,自动生成代码、增加注释、生成测试用例、修复和优化代码等,从而提升研发效率。该工具涵盖了设计、需求、编码、测试、部署、操作和维护等关键阶段,无论是初学者还是有经验的开发者,都能从中受益。
本次发布中,我们开源了以下内容:
- MFT(多任务微调)框架:该框架被称为MFTCoder,能够针对多种代码相关任务进行微调,从而提高模型的表现。
- 增强LLM编码能力的数据集:我们发布了两个数据集,分别是Code Exercise和Evol-Instruction,这两个数据集可以用来训练和增强模型在代码相关任务中的编码能力。
- 基于FasterTransformer的更快速、更可靠的部署框架:该框架可以让模型在执行代码相关任务时实现更高的性能和更快的速度。
由此产生的模型集合包括CodeFuse-13B和CodeFuse-CodeLlama-34B,支持多种与代码相关的任务,如代码补全、文本转代码、单元测试生成等。值得一提的是,CodeFuse-CodeLlama-34B以CodeLlama为基础模型,并利用我们提出的MFT框架进行微调,在HumanEval Python pass@1评估中取得了高达74.4%(贪婪解码)的成绩,这一表现甚至超过了GPT-4(67%)。
关于CodeFuse的搭建过程,需要以下步骤:
- 准备一台云服务器:可以选择各大云服务提供商的服务器,根据实际需要选择配置。
- 准备一个经过备案的域名:域名是用于访问CodeFuse编辑器的网址,需要提前备案。
- 在云服务器上部署Code-Server:Code-Server是一个开源的代码编辑器,支持多种编程语言和插件,可以方便地部署在云服务器上。
- 配置域名解析:将域名解析到云服务器的IP地址上,使得域名能够正常访问Code-Server。
- 配置Code-Server:根据实际需要配置Code-Server,例如设置用户名、密码、编程语言和插件等。
完成以上步骤后,就可以成功将CodeFuse搭建在云服务器上,通过浏览器访问Code-Server,进行代码编辑。
数据统计
数据评估
关于CodeFuse特别声明
本站自媒体导航提供的CodeFuse都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由自媒体导航实际控制,在2024年3月1日 下午1:29收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,自媒体导航不承担任何责任。