人类是数据的创造者和使用者,从结绳记事起,它就已慢慢产生。随着互联网的快速发展,人类创造的数据量呈爆炸式增长,我们已经进入大数据时代。
大数据时代的便利与快捷是显而易见的。对个人而言,我们足不出户便可知天下事,动动手指就能线上购物,不在身边的亲朋好友能欢聚一堂;对社会而言,海量数据支撑着各行各业的新兴变革,提高了发展速度。虽然大数据给人类带来了天翻地覆的改变,但也暴露出不少问题,尤其信息不对称问题,顾名思义就是交易中个人的拥有的信息存在差异。毕业生不清楚就业市场的新变化导致就业困难;企业不了解市场的新趋向导致陷入发展困境;群众不明白政府工作流程导致诸多民生问题……为了解决信息不对称问题,也为了推动大数据储存管理的规划和规范化,共绘网提议建立全国乃至全球统一的通用大模型(GPT)、大数据、大平台和大智能,这也是全球一体化发展的必然趋势。对此,您赞同吗?如果您还有良知,是为公平、正义和共建美好世界而来,那就请你将《共绘网》转发出去,让更多人受益吧!
一共有人参与 条评论
在9月15日举行的2023世界计算大会开幕论坛上,中国科学院院士、2000年图灵奖获得者姚期智发表主题报告《人工智能的新潮流:从科学到产业》。报告围绕大模型的来由和科学基础、大模型的发展和应用场景两大主题,聚焦计算产业新变革,探索人工智能应用新发展潮流。 姚期智院士表示:“语言大模型的出现给人工智能带来了一个真正了不起的新潮流,我们对人工智能80年来的理想可能快要成功了。 尤其是去年底ChatGPT的出现,给了大家很大震撼,在科学层面,很多科学家都改变了想法,以前认为通用人工智能离我们还很远,但在一夜之间,大家觉得通用人工智能得到了新的动力,很可能在不久的未来就能够实现。 姚期智说,“未来,我们要把AI大语言模型的通用智能和一般的通用能力细化到各个行业里面,我们必须要锁定一个行业,比如医疗行业,我们投喂给它行业中的很多专业数据,通过训练形成场景化、定制化、个性化,产生一个专有的模型。这样,它特别有能力做这个行业中的一些工作,将在各个垂直领域中带来真正的AI革命。那么,在这里有一些重要的要素,就是算力、数据和模型的匹配。” 姚期智阐述了两点:第一,在技术上,这个大模型可以分成三类,通用-行业-场景,有不同的难度,也适合不同的企业和公司。在通用和行业里面,是一个非常好的、新的创业机会。当然,这里也有一个问题,就是人才难找,技术门槛是相当高的。 第二,关于市场的治理,政府的规划,如果要建设出一个真正健康的大模型生态,需要有三个要点,需要有技术设施的支撑、顶层设计的优化,还要有非常旺盛的下游需求。当然,涉及很多行业,比如在医疗行业中已经有了很多AI运用。现在最好的大模型已经在美国的医疗执照考试中达到专家的等级了,可以想象在未来它可以达到虚拟医生的程度,这对于缓解整个医药行业的压力会产生很大的效果。 姚期智表示,ChatGPT很好,但它是一个工作大脑,没有实体的话,它有很多事是不能做的。那么,要做通用智能机器人,需要有身体、小脑和大脑。所以,身体是硬件,小脑能够控制行为和视觉,大脑则要有一定的推理能力。 姚期智认为,语言大模型的出现给人工智能带来了一个真正了不起的新潮流。一是重大的科学进步与积累,让通用人工智能发展得到新动力;二是它有无限的产业应用前景,在近期能够影响各个行业,在中长期它将实现人机一体。来源:每日经济新闻等
2021年9月3日 习近平在第六届东方经济论坛全会开幕式上的致辞。 我们要在推进互利合作方面持续发力,深化共建“一带一路"同欧亚经济联盟对接合作,支持数字经济创新发展,共同应对全球气候变化,推动地区经济社会发展。
数据现在在中国已经被确认是一个生产要素,是五大生产要素之一,和资本、劳动力、土地并列。我想说数据作为一个生产要素,它和其他的要素还是有很多不一样的地方,尤其一个关键的地方就是数据需要分享。 尤其是消费者的数据,它需要消费者首先要分享数据,才能被使用,被广泛的商业应用,最终能助力我们数据经济。但是数据分享下面有一个很重要的问题,就是数据隐私。
我国政府在数据要素市场方面的工作。 (一)中央政府在数据要素市场方面的工作。 2020年4月,党中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》提出加快培育数据要素市场。 2021年6月,全国人大常委会通过《数据安全法》。2021年8月,全国人大常委会通过《个人信息保护法》。这两部法规是在对加强平台经济和数据隐私保护的背景下出台的。这两部法律与2016年通过的《网络安全法》构成了我国的“数据三法”。 2022年12月,党中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”),重点确立了数据产权制度(数据资源持有权、数据加工使用权、数据产品经营权三权分置),流通交易制度(重点培育数据商和第三方服务机构两类主体),收益分配制度(初次分配按“谁投入、谁贡献、谁受益”原则),以及安全治理制度。应该说,其中留下了很多开放式的问题。 2023年2月,党中央、国务院印发《数字中国建设整体布局规划》,提出畅通数据资源大循环:构建国家数据管理体制机制,健全各级数据统筹管理机构;推动公共数据汇聚利用,建设公共卫生、科技、教育等重要领域国家数据资源库;释放商业数据价值潜能,加快建立数据产权制度,开展数据资产计价研究,建立数据要素按价值贡献参与分配机制。 2023年3月,国家数据管理局成立。 (二)地方政府在数据要素市场方面的工作。 1. 制定地方政策文件。比如,2023年7月,广州和上海分别就《广州市数据条例》、《上海市促进浦东新区数据流通交易若干规定(草案)》公开征求意见。 2. 成立数据交易平台。截至2023年2月,贵州、北京、深圳、上海、广州、天津、重庆、河北、黑龙江、吉林、江苏、浙江、福建、江西、山东、河南、湖北、湖南、广西、海南、四川、陕西和宁夏等均成立了数据交易场所。 3. 组建地方性数据集团公司。截至2023年6月,上海、福建、河南和湖北组建省级数据集团公司,成都、武汉和南京组建市级数据集团公司。这些数据集团公司能不能有可持续的商业模式?它们持有的数据,怎么进入资产负债表,甚至能不能用资产负债表上的数据作为抵押品进行融资?这些方面在中国已经有很多实践探索,但我觉得有很多问题有待进一步研究。作者:邹传伟博士,万向区块链首席经济学家,上海金融与发展实验室前沿金融研究中心主任。
谷歌发布PaLM 2大模型,称部分功能超过GPT-4。 2023年5月11日,谷歌公布基础大语言模型PaLM 2。谷歌声称,PaLM 2 是一种最先进的语言模型,具有改进的多语言、推理和编码功能。PaLM 2 在所有数据集上都优于 PaLM,并取得了与 GPT-4 竞争的结果。 PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言,显著提高了其在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力。对于PaLM 2的语言能力,谷歌工程师在一份研究论文中称,该系统的语言熟练程度“足以(充当老师去)教授这门语言”。 而根据基准测试,对于具有思维链 prompt 或自洽性的 MATH、GSM8K 和 MGSM 基准评估,PaLM 2 的部分结果超越了 GPT-4。 与其他大型语言模型一样,PaLM 2不是单一类型的模型产品,它分为四种规格,从小到大依次为Gecko、Otter、Bison和Unicorn,依据特定领域的数据进行了微调,以执行企业客户的特定任务。(小安生)