R进阶篇2数据结构

此书翻译自HadleyWickham的《AdvancedR》一书。本人在学习R编程的过程中从此书获益良多。特将此书翻译成中文,希望让更多的中国朋友也能从本书获得帮助,从此更高效的用R做更华丽的数据分析。若有纰漏,欢迎批评和指正。

数据结构

本章主要概括讲解R中的几种最重要的数据结构。你可能已经使用了其中的大部分数据结构,可是确还没弄清楚他们之间的相互关系。在本章,我不会去逐个深入讲解不同的数据结构,而是帮助你理清它们之间整体的关联性。你可以查找R文档来获得对单个数据结构的详细介绍。

R的基础数据结构可以通过维度(1维,2维或n维)和同质或异质性(数据类型是否一致)来概括。以下包括了数据分析中最常用的五种数据结构:

同质异质1维Atomicvector(原子向量)List(列表)2维Matrix(矩阵)Dataframe(数据框)n维Array(数组)

其他所有的数据类型几乎都是建立在这些基础的数据类型之上的。在面相对象指南一章你将会学习如何使用这些基础的数据类型来建立更复杂的数据类型。请注意R语言没有0维和标量类型。那些你会认为是标量的单个数字或者字符串,在R中实际上是一维的原子向量。

查看一个对象数据结构的最简单的方式是使用str()函数。str()是structure(结构)的缩写,它能对任何R数据结构提供简洁明了的描述。

测试

做做这个简单的测试看看你是否需要阅读本章内容。如果你能很快地得到答案,你可以轻松地跳过本章。本章最后提供参考答案。

数组除了它的内容,其他的三个特性是什么?

四种主要的原子向量类型?以及另外两种不常用的原子向量类型?

什么是属性?如何来查看和设置属性?

列表和原子向量有什么不同,矩阵和数据结构有什么不同?

一个列表可以是矩阵吗?一个数据框的一列可以是矩阵吗?

概要

向量介绍R的一维数据结构,原子向量和列表

属性简单的介绍下R灵活的元数据说明方式-属性,这里会介绍原子向量设置属性中的一种重要的数据结构-因子。

矩阵和数组介绍二维和高维的数据结构,矩阵和数组。

数据框学习R中最重要的数据结构-数据框,数据框同时包涵列表和矩阵的特性,是一种非常适合做统计分析的数据结构。

向量

向量是R中的基础数据结构。向量有两种形式:原子向量和列表。它们有如下三种共同特性:

类型,typeof(),是什么。

长度,length(),有多少个元素。

属性,attributes(),其他任意的原数据.

他们主要的不同在于元素的类型:原子向量的所有元素必须是相同的类型,但是列表的元素可以是不一样的类型。

注意:is.vector()并不测试一个对象是否是向量。只有当一个对象是向量并且除了名字没有其他属性时,is.vector()的返回值才是TRUE。请使用is.atomic(x)

is.list(x)来测试一个对象是否为向量。

原子向量

我将详细的介绍下R中原子向量的四种常见的类型:逻辑型(logicle),整型(integer),数值型(double或则numeric)和字符串型(character)。还有两种不常用的类型:复杂型(







































北京哪个医院治疗白癜风最专业
青海白癜风医院



转载请注明:http://www.92nongye.com/xxmb/204613271.html