使用键盘输入
R中有一个函数edit()
可以自动调用一个允许手动输入数据的编辑器,如
1 | data <- data.frame(age=numeric(0)) |
从带分隔符的文本中导入数据
使用read.table()
从带分隔符的文件中导入数据,并将其保存为一个数据框
mydataframe <- read.table(file, option)
函数read.table()
的选项
选项 | 描述 |
---|---|
header | 文件在第一行是否包含变量名的逻辑性变量 |
sep | sep=""表示用空格分隔数据,sep=","表示用逗号分隔,sep="/t"表示用制表符分隔数据 |
row.names,col.names | 用于指定行名列名,header=FALSE时变量会被命名为V1、V2··· |
na.strings | 选择用于表示缺失字符向量,na.strings=c("-9","?")把-9和?全部转换为NA |
skip | 读取数据时跳过行的数目 |
colClasses | 指定以何种格式读取数据的列 |
导入Excel数据
读取Excel文件最好的方式是将其在Excel中导出为一个csv文件,并用read.table()
函数将其导入到R中。另外还可以用xlsx()
配合xlsxjars,rJava包,不过比较麻烦(还要安装Java),还是转化成为csv文件吧,方便!
高级导入方法
前面介绍的是初级阶段的数据导入,高级阶段的包括导入XML数据、网页数据、SPSS数据、Stata数据等等,限于篇幅,这里就不一一赘述了。
特别要推荐的一款软件:Stat/Transfer,它是一款可以在34种数据格式之间作转换的独立应用程序。