写在前面的话
前面三期我们介绍了R语言的概貌,想必大家已经摩拳擦掌,准备直接上手练一把了吧!别着急,正所谓不积跬步,无以至千里。虽然R语言是一个对于处理数据非常灵活的语言,但是如果不打好基础,恐怕难以施展拳脚。
所以,从这一期开始,我们将以一个简单的电影票房的实际数据为例,为大家介绍在实际数据处理中R语言中的基本类型、基本操作。你可别小看这里的“基本”,它的含义是“基本天天都要用”。
言归正传,下面我们就先来介绍一下这个有趣的数据集。
一热门电影数据集简介图1-1《功夫熊猫》电影海报
想必你经常去看电影,对自己喜爱的电影类型、明星大腕如数家珍。在电影的宣传期,我们往往能看到其主演、导演频频现身各大头条,吸引看客眼球,其最后的落脚点往往是“祝***电影票房大卖”。
尽管观影习惯已经开始慢慢养成,电影的方方面面也成为人们茶余饭后的谈资,但是,你有想过通过数据的形式统计一下它们的基本信息吗?比如,本月上映了几部电影?它们是动作戏偏多,还是以喜剧为主?主演是不是当红花旦?这些信息,都可以通过简单的R语言操作来一一获得!
在这里,我们搜集了年1到5月间上映的19部热门电影共10个变量的基本信息,准备以此为例说明如何在R语言中进行相关操作。