R语言基础教程第3章数据结构数据框

数据框

由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你在R中最常处理的数据结构。

每一列数据的模式必须唯一,不过你却可以将多个模式的不同列放到一起组成数据框。由于数据框与分析人员通常设想的数据集的形态较为接近,我们在讨论数据框时将交替使用术语列和变量。

data.frame(data,row.names=NULL,check.rows=FALSE,check.names=TRUE,fix.empty.names=TRUE,stringsAsFactors=default.stringsAsFactors())

data参数的形式要么是value,要么是tag=value。基于标记(如果存在)或离开的参数本身创建组件名称。row.names参数为NULL或单个整数或字符串,指定要用作行名称的列,或给出数据框行名称的字符或整数向量。check.rows如果为真,则检查行长度和名称的一致性。check.names如果为真,则检查数据框中变量的名称,以确保它们是语法上有效的变量名称,并且不重复。如果有必要,可以(通过make.name)对它们进行调整。fix.empty.names:逻辑指示“未命名”的参数(在未被正式调用为someName=arg的意义上)是否得到自动构造的名称,或者更确切地说是名称“”。需要设置为FALSE,即使在检查时也是如此。stringsAsFactors字符向量应该转换为因子吗?“factory-fresh”默认值为TRUE,但是可以通过设置选项来更改(stringsAsFactors=FALSE)。

1数据框的创建

使用data.frame函数就可以初始化一个数据框。比如我们要初始化一个student的DataFrame其中包含ID和Name还有Gender以及Birthdate,那么代码为:

Birthdate-c("-12-29","-5-6","-8-8")Name-c("Devin","Edward","Wenli")Gender-c("M","M","F")ID-c(11,12,13)student-data.frame(ID,Gender,Name,Birthdate)studentIDGenderNameBirthdateMDevin-12-MEdward-5-FWenli-8-8

可用View()函数来查看数据框。

View(student)2数据框的一般操作

dim(student)#查看它的维度length(student)#只输出有列的个数names(student)#只输出列名colnames(student)#也可以这样子输出rownames(student)#要输出行名要用这个#R的数据框的元素选取和矩阵的元素选取很像,#唯一差别就是通过列名选取时,可以使用如下方式选取。student$ID用$符号加上列名,获取该列数据[1]213#由于Gender列是字符串,默认情况下转化为了因子,所以出现了Levels:FM[1]MMFstudent$GenderLevels:FMDoubleHelix

您的赞赏是我发布优质内容的动力









































北京去哪里医院看白癜风
北京哪有看白癜风的



转载请注明:http://www.92nongye.com/ksfc/ksfc/204621707.html