从用户大数据到智能营销的决策基于结

11月24日与11月25日两天,肖邦明老师带我们进行了基于RStudio软件数据相关内容的基本探索。

课程开始前,肖老师带我们回顾了之前Pyhton爬取百度API与RStudio实战操练的课程内容进一步对数据获取的方法与意义进行熟悉与印象加深,并且为每个同学解答问题,耐心辅导。

案例引入:Facebook股票下跌,剑桥分析通过合理地利用Facebook的数据接口,获得了万用户的数据,并将这些数据最终用于帮助特朗普在年的美国总统大选中出。

用于学术研究的数据挖掘是合理合法的,但数据挖掘也是一把双刃剑,Facebook数据泄漏的案例向我们展示了这把剑的锋利,同时也在警戒着我们数据的挖掘要遵守道义与法律,我们在以后的学习工作中要正确使用数据这把锋剑。

肖老师说:“BAT都有属于自己的API,一个能够利用有限的资源,找到需要的数据,从而分析出数据背后的价值的人,是这个社会永远需要的人才。数据挖掘这一思路的培养是课程培训的重中之重。”

(一)标准化模型

1.决策树:最早源于人工智能的机器学习技术。它是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是一种直观运用概率分析的图解法,主要用于智能决策领域。

2.随机森林:迭代优化决策树,是利用多棵树对样本进行训练并预测的一种分类器。多次进行决策树来调整整体预测精准度。

3.神经网络:它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学算法模型。这种网络依靠系统复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。神经网络只能预测二项式数据,类别为二类以上的不能使用神经网络,而且数据必须都为数值型。这在一定程度上让神经网络受到了较大限制。

(二)非标准化模型

非标准模型简单地说就是与自然模型(或称标准模型、期望模型)不同构的模型。非标准模型虽然不是人们所期望的,但是它们有时却有着非常重要的应用。

肖老师带我们学习了MiningBrandperceptionsfromTwitterSocialNetworks与MineYourOwnBusiness:Market-StructureurveillanceThroughTextMining两篇论文,即从Twitter社交网络挖掘品牌感知与通过文本挖掘市场数据从而开展自己的业务。

我们用RStudio实现程序代码,找寻关键词与发生频率,从而构建非标准化模型,也完成了此次课程的小目标即掌握对数据的基本探索。

这个周末,肖老师依然是领路人,带我们不懈探索数据与信息的运用。

与上周相比越来越多的疑问也迎刃而解,相信大家都已经初步建立起数据挖掘的思维方式,这对于今后我们遇到问题解决问题的探索方式会产生巨大的影响,无疑是提高工作效率、适应时代发展的思维方式。

文字

零售菁英荟韩佼洪

排版

零售菁英荟王成龙

零售菁英荟

赞赏

长按







































白癜风的药
哪个医院治白癜风好



转载请注明:http://www.92nongye.com/gaishu/204620971.html