清华系「自然语言编程神器」上新!支持100+种编程语言,效率upup
admin
2023-08-01 16:00:07
0

原标题:清华系「自然语言编程神器」上新!支持100+种编程语言,效率upup

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

清华和智谱AI联合打造的多语言代码生成模型CodeGeeX,更新了!

它支持的编程语言种类 从原来的20种增加到100多种

通过IDE中的插件,可以轻松实现「无缝自然语言编程」。

由于使用了新版基础模型,CodeGeeX2的功能更加强大。

据了解,这次的新版本,精度和速度分别是原来的两倍和三倍,内存消耗却只有1/5。

代码生成、解释、翻译、纠错和编程问答等工作,效率都比以前有显著提高。

作为「课代表」,我们把CodeGeeX的更新概括成了下面这几个方面:

  • 代码能力更强了
  • 模型特性得到了优化
  • AI编程助手功能更全面了
  • 用户协议更加开放
插件版本也将全面更新

模型用起来太繁琐?没关系,除了模型本身的更新,CodeGeeX的插件版本很快也将全面升级至新版。

新插件同样支持超过100种编程语言,说不定比我们知道的还要多。

这之中除了Python、Java等我们耳熟能详的语言之外,还包括Swift、Kotlin等移动端新兴势力。

甚至像Rust这种系统级的编程语言,也在CodeGeeX2的能力范围之内。

比如下面这张动图就展示了CodeGeeX2生成Kotlin代码的场景。

代码生成的速度简直比人类输入指令的速度还快。

而且从中我们可以看到,CodeGeeX2添加注释或debug都能一键完成。

不仅是设计算法,实用程序的编写也是小菜一碟。

补全个vue.js代码,搭建出网页,效率杠杠的!

除了这些代码相关的任务,CodeGeeX2还有很多其他应用场景。

比如查询SQL数据库。

只要打开问答模式,用自然语言描述想要查询的内容,CodeGeeX2就能自动生成SQL查询语句。

模型变强之后,会不会收费呢?不必担心,新版CodeGeeX插件将 继续对个人用户免费开放

而6B参数的CodeGeeX2,也已经进行了开源,相关代码可以到GitHub仓库中查看。

GitHub Copilot的模型也不是对手

OpenAI的HumanEval评测标准可以很好地评价生成代码的表现。

这个名字很容易理解:模型生成的代码质量如何将由人类来评价。

在HumanEval评测中,6B参数的CodeGeeX2的得分 比15B参数的StarCoder模型还要高,可谓是四两拨千斤。

而GitHub Copilot中曾使用的Code-Cushman-001模型同样不是CodeGeeX2的对手。

不过,CodeGeeX毕竟是一个多语言模型,而HumanEval却只支持Python。

所以,为了更加准确地测试CodeGeeX的表现,智谱团队在其基础上增加了Go、C++、Java和JS四种语言的测试数据,得到了HumanEval-X数据集。

结果显示,在多语言方面,新版CodeGeeX2的表现和在Python中一样优异。

相较于第一代,CodeGeeX2的Pass@1指标在各个语言上的 平均表现提升了107%

其中, Rust语言的性能提升显著,提升了321%;C++和JS语言上的表现也提升了70%以上。

而在代码翻译方面,CodeGeeX2的表现同样碾压对手。

「不看广告看疗效」,CodeGeeX不仅测试结果优异,用户的认可度也是很高的。

在「CodeGeeX是否提高了编程效率」这一问题中,有 83.4%的用户给出了正面的答案

除了调查结果,用户们也在「用脚投票」。

自第一个版本发布以来,CodeGeeX的下载量已达12万次,平均每天生成近千万行代码。

这是个什么概念呢?如果只看代码行数,相当于不到一周的时间就写出一套Windows XP。

说了这么多,CodeGeeX又该如何体验呢?

快速体验

第一种方式就是IDE中的插件,VScode和JetBrains系列IDE的插件仓库中均有收录。

除了使用IDE中的插件之外,CodeGeeX也可以在Transformer中快速调用。

fromtransformers importAutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained( "THUDM/codegeex2-6b", trust_remote_code= True)

model = AutoModel.from_pretrained( "THUDM/codegeex2-6b", trust_remote_code= True, device= 'cuda')

model = model.eval

# remember adding a language tag for better performance

prompt = "# language: python\n# write a bubble sort function\n"

inputs = tokenizer.encode(prompt, return_tensors= "pt").to(model.device)

outputs = model.generate(inputs, max_length= 256, top_k= 1)

response = tokenizer.decode(outputs[ 0])

>>> print(response)

# language: python

# write a bubble sort function

没有支持的IDE,Transformer又觉得麻烦,但还是想体验怎么办?

没关系,这里还有个还有在线版DEMO。

传送门:https://codegeex.cn/zh-CN/playground

赶快来感受一下「无缝自然语言编程」吧!

论文地址:

https://arxiv.org/abs/2303.17568

Github项目页:

https://github.com/THUDM/CodeGeeX2

Hugging Face项目页:

https://huggingface.co/THUDM/codegeex2-6b

「AIGC算力全景与趋势报告 · 量子位智库」下载

AIGC时代,算力成为「硬通货」。当前大模型的发展对算力产生新的需求,算力行业迎来变革机会。机遇当前,量子位智库发布《AIGC算力全景与趋势报告》,扫描下方二维码即可查看完整报告。

8月9日,我们将在北京举办「量子位AIGC行业沙龙——AIGC时代的算力基石」,欢迎感兴趣的企业联系~

点这里 👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关内容

热门资讯

原创 1... 在人民币收藏领域,1元纸币因其流通时间长、版本多样、设计独特而备受关注。每个时代的1元纸币都承载着独...
全柴动力新提交1件商标注册申请 证券之星消息,根据企查查数据显示,近日安徽全柴动力股份有限公司新提交1件商标注册申请。商标申请详情如...
【1月1日】相约升钟湖 共赴这... 看南部网推荐百家号 获取精彩独家资讯! 爆料微信:15520870888 正文 升钟湖“庆元旦...
国家5A景区,吉林省+1! 12月27日,文化和旅游部发布《文化和旅游部关于确定19家旅游景区为国家5A级旅游景区的公告》,吉林...
1月1日元旦,记得提醒家人吃这... 1月1日元旦,记得提醒家人吃这4道“开运菜”福满财多寓意好,欢乐过新年! 时光如梭,转眼间2024年...
原创 阿... 做客的、赛前排名第19的升班马伊普斯维奇队迎来了英超第18轮的较量,伊普斯维奇队此役做客PK赛前排名...
力源信息新提交1件商标注册申请 证券之星消息,根据企查查数据显示,近日武汉力源信息技术股份有限公司新提交1件商标注册申请。商标申请详...
航天工程新注册《总包造价软件V... 证券之星消息,近日航天工程(603698)新注册了《总包造价软件V1.0.1》项目的软件著作权。今年...
国家通知!这种疫苗,调整了!明... 重要提醒!! 孩子们打的一类疫苗 有调整!!! 根据《关于国家免疫规划百白破疫苗和白破疫苗免疫程序调...
1月1日起,暂停!广东紧急通知 今天(12月27日) “广东税务”发布最新通告 2025年1月1日00:00至1月5日24:00 暂...
2025年1月1日!交通管制! 12月25日 阳泉市交警一大队发布 关于2025年阳泉市矿区新年登高 全民健身活动期间 交通管制的通...
陕鼓动力将于1月13日召开股东... 金融界12月27日消息,陕鼓动力发布公告,将于2025年1月13日召开第1次临时股东大会,网络投票同...
1+1观影团《误判》甄子丹“以... 由黄百鸣、甄子丹联合监制,甄子丹导演的贺岁档动作电影《误判》将于12月27日正式与观众见面。片中,曾...
上海气温暴跌至零下5℃!冷空气... 上海人注意! 北方有一股冷空气正在南下 今天5点钟 它的前锋已经到达华东地区北部 预计今天下午开始影...
突发!以色遭高超音速导弹袭击,... 据央视新闻,当地时间12月27日,也门胡塞武装发言人叶海亚·萨雷亚发表声明称,胡塞武装使用“巴勒斯坦...
颐和园:2025年1月1日起游... 新京报讯 据颐和园官微消息,北京市颐和园管理处12月27日发布温馨提示: 颐和园于2024年10月至...
哈尔滨市出租车计价新规明年1月... 近日,哈尔滨市交通运输局、哈尔滨市发展和改革委员会联合印发《关于印发哈尔滨市巡游出租汽车计价规则的通...
英超-近13场仅1胜!哈兰德点... 央视网消息:英超第18轮,曼城主场迎战埃弗顿。上半场格瓦迪奥尔中柱,B席破门,阿坎吉踢空+刘易斯漏人...
北京菜市口百货股份有限公司党委... 北京商报讯(记者 王维祎)12月26日,由北京市商务局指导,北京日报报业集团和北京市商业联合会共同主...
哈尔滨冰雪大世界勉强盈利,小型... 文|劲旅网 哈尔滨冰雪大世界一经开业,再次成为今年绝对顶流。尽管票价高达300元+,但丝毫阻拦不住...