大数据文摘作品,转载具体要求见文末
编译团队
寒小阳黄念黄卓君
作者
MeganRisdal
目前,Kaggle用户在我们的开放数据科学平台上创建了近万颗内核。这代表了惊人且不断增长的可再现知识。我发现我们的代码和数据库是目前了解Python和R最新技术和库的好地方。
在这篇博客中,我将一些优秀的用户内核变成迷你教程,作为在Kaggle上发布的数据集进行绘制地图的开始。这篇文章中,你将学习如何用Python和R,使用包括实际代码示例的几种方法来布局和可视化地理空间数据。我还列出了资源,以便你可以了解每个教程中突出显示的每个包以及进一步的用户分析,从而获得更多的灵感。
前言
为了探索目的而创建一个简单的地图不再需要你学习如何操作shapefile或想象投影。并且,无论你喜欢在R或Python,都有快速和简单的方法把你的数据展现在地图上。
注:Shapefile文件是描述空间数据的几何和属性特征的非拓扑实体矢量数据结构的一种格式
R地图
对于R用户,KagglerUmesh显示,你需要的是ggplot和HadleyWickham的地图包,借助CDC在Kaggle上发布的数据,以显示美国哪些州每日吸烟者的百分比最高。
数据包下载链接:北京中医院治疗白癜风效果怎么样海口白癜风医院