有了充足的算力资源,才能够向用户提供人工智能服务……
很不巧,智云集团开源的GTAI2模型,只支持智云集团旗下的显卡……对其他企业的显卡并不支持。
这意味着,其他企业要使用GTAI2模型的话,就必须同步使用智云集团旗下的显卡。
小型企业部署小规模内部应用的GTAI2,根据智云集团公布的配置方案,推荐采用8*2的APO4600显卡服务器。
单台服务器部署八片APO4600显卡,这也是APO4600显卡推荐使用的单台服务器互联方案,同时采用两台这样的服务器。
那么就可以使用GTAI2开源的满血版模型,获得完整的逻辑推理能力……但是这种级别的算力,也只能维持基本运行,同时给少量用户提供算力请求。
用户数量稍微多一些,询问的问题比较复杂的话,那么服务器给用户反馈答案的时间就会变得比较久了。
智云集团方面推荐的这个配置的参考并行用户数量是二十人……同时只能有二十个人使用,超过就会变得很卡顿了。
然而即便是8*2张APO4600显卡组成的数据中心GPU服务器,其价格也非常昂贵的,仅仅是这十六张显卡,就得两百五十万左右……这还不包括其他费用的。
一台GPU服务器,除了需要显卡外,还需要CPU,内存,闪存这些东西,而且无一例外也需要当下最顶级的配置。
智云集团推荐需要使用WZ260CPU,这是智云集团旗下威智科技有限公司,基于X86指令集推向市场,采用十二纳米工艺的旗舰级服务器CPU多GPU并联,这个CPU性能强悍,但是价格也很贵的。
内容未完,下一页继续阅读