奇安信科技集团股份有限公司副总裁
刘前伟
随着大模型特别是Deepseek的出现,今天大家在数据的挖掘、开发利用上已经很普遍了。有一个观点也是最近交流了大量的客户发现的点,今天大家大规模使用人工智能大模型的时候,小数据的安全变得至关重要,我认为是迫在眉睫必须解决。
什么是小数据?过去大家手里都有很多数据,刚刚几位嘉宾也都谈到了,但是在很多时候撇开公共数据来看,特别是看行业数据、企业数据,是经过清洗、加工、标注后会形成一个体量规模相对来说很少的数据,这个数据大家拿它充分地挖掘它的价值。但是事实上据我们观测还有相关的报告来看,私有化部署大模型的企业90%以上都在裸奔。
这带来一个问题,今天Deepseek的出现之后,人工智能已经做技术平权了,可能行业最大的竞争力在于数据,数据最大的竞争力就是相对来说比较少的小数据,而小数据又部署在相对来说比较开放的环境下没有受保护。如果直接拿走了这个小数据,你的行业竞争力可能就没了,这是一个很至关重要的问题。
第二个问题就是今天我们看到的公共数据很多时候对于数据的流通在数据集,可以想一下未来人工智能大模型真正跑起来,流通的大部分是数据产品和服务。这些背后流通的通信的唯一方式是API,对于这种模型本身出来的应用它的安全就变得很重要,如果这些数据不管是通过什么方式一旦被不法分子获取,可能获取少量还好,如果大规模把这些数据获取走,轻则影响企业经营,重则影响到行业和产业的发展。这两个问题迫在眉睫,必须解决。
人工智能大模型、小数据的安全可能是需要从一些方面有一些思考。
第一,最想保护的数据资产自己很清楚,理论上每个企业、每个单位都很清楚,对这类东西还是应该采用原来的那套网络安全时代说的东西严防死守。因为这是你的核心竞争力。
第二,围绕着人工智能大模型的应用,因为要流通一定需要应用,就要构建起大模型应用的空间,控住哪些人能够访问到这些数据,你的数据想开放到哪些地方,你的数据服务应该是被谁去使用,能不能被追踪,这些是需要解决的。
(以上内容根据嘉宾发言速记整理)
扫一扫在手机上查看当前页面
