数据框
由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你在R中最常处理的数据结构。
每一列数据的模式必须唯一,不过你却可以将多个模式的不同列放到一起组成数据框。由于数据框与分析人员通常设想的数据集的形态较为接近,我们在讨论数据框时将交替使用术语列和变量。
data.frame(data,row.names=NULL,check.rows=FALSE,check.names=TRUE,fix.empty.names=TRUE,stringsAsFactors=default.stringsAsFactors())
data参数的形式要么是value,要么是tag=value。基于标记(如果存在)或离开的参数本身创建组件名称。row.names参数为NULL或单个整数或字符串,指定要用作行名称的列,或给出数据框行名称的字符或整数向量。check.rows如果为真,则检查行长度和名称的一致性。check.names如果为真,则检查数据框中变量的名称,以确保它们是语法上有效的变量名称,并且不重复。如果有必要,可以(通过make.name)对它们进行调整。fix.empty.names:逻辑指示“未命名”的参数(在未被正式调用为someName=arg的意义上)是否得到自动构造的名称,或者更确切地说是名称“”。需要设置为FALSE,即使在检查时也是如此。stringsAsFactors字符向量应该转换为因子吗?“factory-fresh”默认值为TRUE,但是可以通过设置选项来更改(stringsAsFactors=FALSE)。
1数据框的创建使用data.frame函数就可以初始化一个数据框。比如我们要初始化一个student的DataFrame其中包含ID和Name还有Gender以及Birthdate,那么代码为:
Birthdate-c("-12-29","-5-6","-8-8")Name-c("Devin","Edward","Wenli")Gender-c("M","M","F")ID-c(11,12,13)student-data.frame(ID,Gender,Name,Birthdate)studentIDGenderNameBirthdateMDevin-12-MEdward-5-FWenli-8-8
可用View()函数来查看数据框。
View(student)2数据框的一般操作
dim(student)#查看它的维度length(student)#只输出有列的个数names(student)#只输出列名colnames(student)#也可以这样子输出rownames(student)#要输出行名要用这个#R的数据框的元素选取和矩阵的元素选取很像,#唯一差别就是通过列名选取时,可以使用如下方式选取。student$ID用$符号加上列名,获取该列数据[1]213#由于Gender列是字符串,默认情况下转化为了因子,所以出现了Levels:FM[1]MMFstudent$GenderLevels:FMDoubleHelix
您的赞赏是我发布优质内容的动力