萨摩耶云:模型数据升维,AI决策“破圈”

本刊讯 人类对人工智能的想象和探索,从未止步。

随着数据算法、算力能力提升,人工智能的应用场景深入到生活的方方面面。我们在搜索引擎上输入关键词后,网页会自动匹配相关搜索内容;短视频App能根据我们的浏览习惯,推送相似的博主和场景;对着智能手机等移动终端喊话,便能调用相关功能,实现人机交互。

以人工智能为代表的数字化产业快速向前推进,产业数字化转型也成为不可逆的趋势,各行各业都在寻求与自身商业模式相匹配的AI大脑。AI决策能力,正是AI大脑的内核,它决定了AI解决方案的效率和可执行性。

AI决策由模型性能决定,而模型性能的好坏,离不开人工智能三驾马车的拉动——数据、算法、算力。其中,数据在模型搭建过程中起基础性作用,一个模型的优劣,百分之八十取决于数据和样本维度,正如巧妇难为无米之炊。

因此,数据提升对于模型优化有着基础性、全局性的作用,而数据与模型也是AI系统的重要组成部分。目前,AI模型开发及应用难点,主要在于数据应用和算法创新上,其中,后者更多体现的是建模方法的适当性。

数据应用维度不足。从AI决策的模型发展现状来看,当前很多模型仅仅是基于二维的数据组织形式来构建,没有考虑到数据在完整周期中的时间节点变化。最终容易导致模型的辨识度、准确度、稳定性失衡,AI决策效果大打折扣。

例如,在视频推荐和电商推荐场景中,如果模型仅是在用户账户、行为属性、社交记录、交易结果等标准数据集上构建和优化,没有纳入用户在决策过程中的重要时间节点下的行为表现,可能就会使模型效果过于拟合,不能够精准地预判用户喜好以及交易风险控制。

一般来讲,二维数据的维度主要表现为样本维度和特征维度。样本维度常常为用户ID信息或者是订单编号,特征维度则为用户人口属性、行为属性、外部资信等信息。二维数据模式下,用户在每个时间点只对应一条变量

回到实际业务场景,用户在不同的时间节点会呈现不同的行为表现,尽管这些表现强度存在差异化,但最终会反馈到行为特征上。如果把不同时间节点的用户特征行为差异,尽可能纳入建模过程,那么原有的一对一二维数据就延展至一对多的时间序列形式,也就是说把数据应用升维到样本维度、时间维度、特征维度的三维数据组织形式。

三维数据不仅能降低数据集特征不足的影响,而且能最大程度挖掘数据价值,增加特征数量,提升模型准确性。尤其是在业务数据获取时,外部资信等数据往往会遇到接入不确定因素,而内部数据数量和类型有限,并且利用程度趋于饱和。

但对于模型开发而言,更高的精准度和辨识度,要求引入更多维度的数据,挖掘数据规律,生成更多衍生变量。一旦无法从数量维度获取更多变量,那么只能从质量角度下功夫,向深度挖掘变量内部信息,其中一对多的时间序列角度的升维就是深挖数据信息的方法之一。

其实,数据升维可用于AI模型优化的场景非常多,例如在股票、基金的智能投顾业务中,AI模型的数据应用加入时间维度,与样本维度和个股、个基一起构成三维样本,便能把节点变量考虑在内,更加精准预判未来走势。

要想通过高维时序数据实现模型优化,仅停留在数据层面远远不够,还需对算法提升。决定模型好坏的剩下20%,正是建模方法的选择,而与高维时序数据处理相匹配的算法通常为基于神经网络算法的深度学习。

以萨摩耶云为例,萨摩耶云基于深度学习框架,探索数据升维用于模型性能的提升,研发出适用于多行业和场景的AI解决方案,满足企业高效智能决策的需求。同时,这些端到端的云原生科技解决方案,以SaaS+aPaaS形式提供交付,通过双方系统对接实现信息实时交互,能为合作伙伴输出基于云的智能决策服务。

在萨摩耶云首席科学家王明明看来,更高维度的时序数据建模意味着对现有的业务数据的重新理解、更多的数据信息、更复杂的数据组织方式、更高的机器性能要求、存储要求以及模型上线要求。以高维时序数据为基础,施以神经网络来训练,加工多维变量特征,最终建立并优化模型的AI决策能力。

具体来看,作为机器学习的重要分支,神经网络是从数据中学习表示的一种新的方法,强调从连续地层中进行学习。在神经网络算法驱动下,模型可在同一时间共同学习所有表示层,可能包含数十个甚至上百个连续层,而其他机器学习方法往往仅仅学习一两层的数据表示。

神经网络在高维时序数据学习中,一方面通过渐进的、逐层式的方式形成越来越复杂的表示;另一方面,对渐进的表示共同进行学习,每一层的变化都需要同时考虑上下两层的需要。这意味着,循环神经网络引入状态变量时,能保存每个时刻的信息,并且与当前的输入共同决定此刻的输出。

从萨摩耶云的AI决策实践来看,萨摩耶云在模型搭建过程中,不仅考虑了以往的样本维度和特征维度,还把各时间节点的用户特征差异纳入考量,通过三维数据加工完善数据特征。在此基础上,萨摩耶云利用神经网络、深度学习,建立和训练模型,实现比常规模型更为高效的模型效果。

这对于提升模型的预判能力和精准度至关重要。就像阅读一段新闻,如果仅仅从每一个字、每一个词组来理解,很容易断章取义,无法真正明白新闻所指。但把新闻构成中的字词句连贯起来,并置于各个背景节点中,就可以理解新闻的准确意思。

当萨摩耶云把基于神经网络等技术的AI模型,应用于实际业务场景之中,能进一步放大数据价值,帮助企业增强预测分析能力,提升精准营销、销售管理、供应链协作、结果预测、风险控制的效率,进而实现从经验决策到智能决策,达到降本增效的效果。

实验数据也表明,用神经网络的时间序列来做变量衍生,可以产生较为显著的变量增益效果,衍生变量可以直接用于其他传统方式的建模环节,同时也可扩充内部的衍生变量空间。当原始特征的区分能力得到提升,模型的区分效果也得到增强,最终强化AI模型性能。

作为领先的独立云服务科技解决方案供应商,萨摩耶云立足场景需求,深耕AI决策智能赛道,不断升级大数据、算法、模型策略和产品设计,为数字经济和企业数字化转型提供技术支撑。在此过程中,萨摩耶云不仅强化了自身核心自主竞争力,而且着眼数字中国全景,源源不断释放科技赋能的价值。(山河)

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年6月16日
下一篇 2022年6月16日

相关推荐

  • 怎么样才能提高excel的效率?

    提高Excel的操作效率,最直接的方法当然是使用快捷键,一方面快捷键减少了调用菜单的层级,让你直达最终的命令,另一方面可以批量进行操作,一次性完成多项操作。 001、最厉害的Exc…

    2022年7月23日
  • “重启手机”和“关机再开机”没有任何区别?原来大部分人都错了

    导读:“重启手机”和“关机再开机”没有任何区别?原来大部分人都错了 我国智能手机行业发展十分迅速,国产品牌也相当不错,已经将三星“吓”跑了。不过就目前来看,苹果在我国还是具有一定的…

    2022年6月13日
  • 我的姐姐爱养花

    我的姐姐大我两岁′他留着长头发’在我的记忆里,姐姐既懂事又爱干活儿。又爱养些花花草草’也很喜爱帮助家里干活。把屋里屋外收拾的干干净净,姐姐,她很聪明,学习也很努力, 爸爸妈妈经常夸…

    2022年4月28日
  • 董卿老公密春雷终于现身!将重回工作岗位履职,夫妻俩已消失数月

    今天,览海集团终于发布声明,宣布公司董事长密春雷将于明天起重新回归岗位履职,一时间也是引起不少人的围观和热议。 不少网友都开始热议和询问之前的数月里密春雷到底去哪里了呢?因为密春雷…

    2022年7月7日
  • 气候学家“联名上书”:模型的使用夸大了全球变暖的影响

    “到本世纪中叶,北极将成为多雨地区,比预期提前数十年。” “到2100年,美国西部森林火灾造成的空气污染可能会增加两倍。” “几百年后,海洋即将出现物种大灭绝。”…… 图源:pix…

    2022年8月15日
  • 三种旅游攻略

    自驾,自助,跟团。 我也曾跟团,也曾自助,更曾跟过自驾,这三种方式各有利弊。 自驾游的最大好处:就是按照自己的喜好游览,没有时间的限制,在一个景点可以长时间游玩。 不过也有一个弊端…

    2022年8月12日
  • 现读三本学校很烂,要不要重考去专科?

    的确一些三本学校很垃圾,某些专科说起来很强,但说出去谁又认识你哪个学校的。我读的就是号称我省前几的laji专科学校。真的是自己给自己长脸的学校。专科学校一天到晚琐事多。周围的同学百…

    2022年7月17日
  • 《少年派2》:林妙妙或许到死都不知道,吕佳维“挑上”她的真相

    如果不是因为钱三一突然出现在了林妙妙的生活中,她不会那么早选择与吕佳维走到一起,起码会在得知钱三一的消息,或是知道他有了另一半之后,才有可能接受吕佳维的追求。但钱三一避之不见,还有…

    2022年7月26日
  • “黑匣子”到底是什么?(为何空难后都关注它?)

    当飞机出现故障坠毁后,相关部门除了搜救以外,还会打捞飞机的黑匣子,那么黑匣子是什么意思?有什么用?很多人都是比较的疑惑。 黑匣子是什么意思?有什么用? 黑匣子是飞机专用的电子记录设…

    2022年4月18日
  • 「六一寄语」女儿,我要对你说

    六 一 寄 语 孩提是最幸福的时光,童年往往最令人向往,童真童趣令我们终身难忘。又是一季“儿童节”,让我们抽出些许光阴,重温儿时的梦想,紧握前行的方向! 作为一名人民警察,对女儿的…

    2022年6月4日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息