环球最资讯丨llama.cpp作者创业，用纯C语言框架降低大模型运行成本

日期：2023-06-18 15:17:16 来源：腾讯网

机器之心报道

机器之心编辑部

大模型的应用前景将越来越广泛。

【资料图】

通常，神经网络的推理代码是使用 Python 语言编写的。但相比于 Python，C/C++ 代码运行速度更快，编写过程更严谨，因此一些开发者尝试用 C/C++ 语言实现神经网络。

在众多使用 C/C++ 语言编写神经网络代码的开发者中，Georgi Gerganov 是一位佼佼者。Georgi Gerganov 是资深的开源社区开发者，曾为 OpenAI 的 Whisper 自动语音识别模型开发 whisper.cpp。

Georgi Gerganov

今年 3 月 Georgi Gerganov 又构建了开源项目 llama.cpp，llama.cpp 让开发者在没有 GPU 的条件下也能运行 Meta 的 LLaMA 模型。llama.cpp 让开发者在没有 GPU 的条件下也能运行 LLaMA 模型。项目发布后，很快就有开发者尝试并成功在 MacBook 和树莓派上运行 LLaMA。

打开 Georgi Gerganov 的个人主页，我们发现全是开源项目，满满的干货。

现在，Georgi Gerganov 宣布创立一家新公司 ggml.ai，旨在支持 ggml 的开发。ggml 是 Georgi Gerganov 使用 C/C++ 构建了机器学习张量库，能够帮助开发者在消费级硬件上实现大模型，并提升模型性能。ggml 张量库具有以下特点：

用 C 语言编写；

支持 16bit 浮点数；

支持整数量化（包括 4 位、5 位、8 位）；

自动微分；

内置优化算法（例如 ADAM、L-BFGS）；

为 Apple 芯片设置特定优化；

在 x86 架构上使用 AVX / AVX2 Intrinsic；

通过 WebAssembly 和 WASM SIMD 提供 Web 支持；

无第三方依赖；

运行时零内存分配；

支持指导型语言输出。

作为纯 C 语言编写的框架，ggml 大幅降低了大模型的运行成本。llama.cpp 和 whisper.cpp 都使用了 ggml，我们来看一下使用 llama.cpp 和 whisper.cpp 的例子。

下图是一个在树莓派上使用 whisper.cpp 检测短语音命令的例子：

在单个 M1 Pro 上同时运行 LLaMA-13B + Whisper Small 的 4 个实例，如下图所示：

在 M2 Max 上以 40 tok/s 的速度运行 LLaMA-7B，如下图所示：

总体来说，ggml 让本地运行大型语言模型变得更容易，操作更便捷。Georgi Gerganov 成立新公司之后，简单高效的 ggml 张量库将获得更多开发者和投资者的支持。我们相信随着开发人员在技术层面做出努力，大模型的应用前景将会越来越广泛。

参考链接：http://ggml.ai/

标签：

上一篇：Raquel Allegra 2023春夏系列，渐变色彩，宽松裙装的舒适-世界看热讯

下一篇：最后一页

投资促进

精彩推送

环球最资讯丨llama.cpp作者创业，用纯C语言框架降低大模型运行成本

今年TikTok美国广告收入有望达59.6亿美元，是去年2.8倍

特斯拉10年交付近300万辆电动汽车 有望7月底突破

辽宁新增2例本土新冠肺炎确诊病例、61例本土无症状感染者

黑龙江新增本土确诊病例16例、本土无症状感染者17例

天津市新增1例本土确诊病例、3例本土无症状感染者

北京新增2例境外输入确诊病例和4例无症状感染者

环球速讯：记者：拜仁可能同时签下保-托雷斯和金玟哉

环球热讯:这新片养眼又撩人，甜妹海王太好嗑了！

时讯：川航云南分公司开展安全生产宣传咨询日活动

cad画45度斜线命令_cad怎么画角度斜线 热点

毛阿敏越老越时髦，穿白西装内搭蓝T恤，“长一截”不怪还挺潮

海通证券(06837)将于7月28日派发末期股息每10股2.1元_当前看点

这两份年度榜单近日揭晓，静安这些企业上榜！_全球头条

每日聚焦：你快乐吗？关晓彤活动照曝光，身材臃肿发胖，肚子也显得臃肿

关于征集第十届中国LED首创奖金奖样品的通知

《宇宙探索编辑部》龚格尔才是最惨的，还没说几句就没他事了

南京嘉环科技有限公司招聘_南京嘉环科技有限公司

胡丹丹举重女子50公斤级夺金 app（胡丹丹举重女子50公斤级夺金）

财政部：1-5月国有土地使用权出让收入14893亿元 同比下降20%

以“数智”为核心续写台州制造业辉煌|实时焦点

环球实时：蔡同德堂副总经理龚忆：智能审方等让老字号企业焕发新机

重庆将经历新一轮强降雨 存在暴雨地质灾害和中小河流涨水风险_每日快播

普京签令授予世界首位女宇航员瓦莲京娜·捷列什科娃“加加林勋章”-天天热资讯

焦点观察：火力苏打暗枭怎么克制

众智科技06月16日主力大幅流出_今日聚焦

大漠戈壁展雄姿 甘肃电投积极助推新能源发展

富士康新事业总部招聘汽车人才-当前关注

环球热议:港股异动｜艾伯科技(02708)现跌超12% 预计年度净亏损约2.5亿元 同比由盈转亏

今日看点：未来，电影会否被技术“驯化”？

唯将终夜长开眼报答平生未展眉这句诗用来形容什么的_唯将终夜长开眼的出处

世界观点：毋庸置喙的意思（毋庸置疑的意思）

全球今头条！睡眠不足，让肚子长肥肉！JACC研究

热点聚焦：设计思维包括_设计思维

全球快资讯：我的御剑日记瑶台镜如何达到百分之百探索度 瑶台镜探索攻略

手部美学创领品牌——茉初与京东携手达成深度合作

天天百事通！海南最好地段房价，融创高新

【全球聚看点】水牌是什么材质_水牌是什么

当前短讯！石头科技入选中国全球化品牌50强

场内基金账户和场外基金账户有什么不同 有哪些区别 全球通讯

2023百度AI营销中国行长沙站开启

基金分红：大成惠业一年定开债发起式基金6月21日分红

盲盒经营行为规范指引公布，不得向未满8周岁未成年人销售 世界新视野

延吉农村党建“书记加油”擂台比武|当前速递

“驻村诗人”余周德：用诗意与汗水抒写“远方”|每日速看

谷歌大力推广聊天机器人Bard，但警示内部员工谨慎使用-环球观天下

当前时讯：圆的面积公式是什么怎么推导的_圆的面积公式是什么

上海二中院一审公开开庭审理上海通江投资集团有限公司、张保国集资诈骗案

环球今日讯！绥宁市属于哪个市 遂宁市属于哪个市

5月70城二手住宅价格环比转跌，北上广深二手房价下降-全球即时

音乐疗愈致敬白衣天使 “医艺结合 四季雅集”云端精品沙龙音乐会举行_世界热议

2023年雅思奖学金计划开放申请

宁德时代、隆基绿能等11股获特大单资金净流入超2亿元 世界焦点

当前头条：2023年6月MLF操作点评：6月MLF操作利率如期联动下调，宽信用过程有望再度提速

美媒评30队首发控卫榜：库里居首 掘金穆雷仅第十湖人拉塞尔第19

看点：三部门发文加强青少年足球联赛管理：坚决杜绝假球等问题

收购事项构成关联交易 西部矿业收到上交所问询函-天天百事通

特斯拉10年交付近300万辆电动汽车有望7月底突破

cad画45度斜线命令_cad怎么画角度斜线热点

财政部：1-5月国有土地使用权出让收入14893亿元同比下降20%

重庆将经历新一轮强降雨存在暴雨地质灾害和中小河流涨水风险_每日快播

大漠戈壁展雄姿甘肃电投积极助推新能源发展

环球热议:港股异动｜艾伯科技(02708)现跌超12% 预计年度净亏损约2.5亿元同比由盈转亏

全球快资讯：我的御剑日记瑶台镜如何达到百分之百探索度瑶台镜探索攻略

场内基金账户和场外基金账户有什么不同有哪些区别全球通讯

盲盒经营行为规范指引公布，不得向未满8周岁未成年人销售世界新视野

环球今日讯！绥宁市属于哪个市遂宁市属于哪个市

音乐疗愈致敬白衣天使 “医艺结合四季雅集”云端精品沙龙音乐会举行_世界热议

宁德时代、隆基绿能等11股获特大单资金净流入超2亿元世界焦点

美媒评30队首发控卫榜：库里居首掘金穆雷仅第十湖人拉塞尔第19

收购事项构成关联交易西部矿业收到上交所问询函-天天百事通