R语言基础知识笔记

2024-05-19 02:04

1. R语言基础知识笔记

1、向量是用于存储数值型，字符型或者逻辑型数据的一维数组。执行组合功能的函数为c()，可以用来创建向量。向量可根据位置进行索引，需要用[]。
  
 2、矩阵是一个二维数组，每个元素都拥有相同的模式，可通过函数matrix()创建矩阵。
  
 3、数组是一个可以在两个以上维度存储数据的数据对象。例如，如果创建尺寸(2,3,4)的数组，那么就是创建4个矩形矩阵每个2行3列。数组只能存储数据类型。
  
 4、矩阵和数组一样都只能包含一种数据类型，当有多种模式的数据时，使用数据框就更为方便。数据框可以用函数data.frame () 创建。
  
 5、$  被用来选取一个给定数据框中的某个特定变量。
  
 6、attach()绑定数据集，detach()解除数据集。
  
 7、with：attach，detach最好在单独的数据框内使用，在多个同名对象最好不要使用，函数with()，可以再具有多个同名对象的数据框内使用，但是必须加入花括号{}，这样就无须担心名称冲突了，但是它也有局限性，赋值仅在此函数的括号内生效。
  
 8、列表是一些对象的有序集合。
  
 9,、数据导入 read.table()，其中header = T，代表第一行为变量名称，不作为数据，header = F相反。sep代表数据分隔符，txt为"\t",csv为","。
  
 10、table函数，用 table() 函数统计因子各水平的出现次数（称为频数或频率）。
  
 >sex = c("女","女","女","男","男")
  
 >table(sex)
  
 >sex
  
   男 女
  
   2 3
  
 求众数
  
 > aim = table(sex)[table(sex)==max(table(sex))]
  
 > aim
  
   女
  
    3
  
 > max(table(sex))
  
 [1] 3
  
 > table(sex)==max(table(sex))
  
   sex
  
   男    女
  
   FALSE TRUE
  
 11、 无尺度网络： 是指在某一复杂的 系统 中，大部分节点只有少数几个连结，而某些节点却拥有与其他节点的大量连结。这些具有大量连结的节点称为“集散节点”，所拥有的连结可能高达数百、数千甚至数百万。这一特性说明该网络是无尺度的，因此，凡具有这一特性的网络都是无尺度网络。
  
 12、options(stringsAsFactors = F)
  
 #在调用as.data.frame的时，将stringsAsFactors设置为FALSE可以避免character类型自动转化为factor类型。
  
 13、class()：查看数据结构：vector、matrix、array、dataframe、list。
  
 14、str()：作用用英语来表示是：check classification of viriables,一般用于检查数据框当中有哪些数据。
  
 15、mode() ：查看数据元素类型。
  
 16、typeof() ：查看数据元素类型，基本等同于mode（），比mode()更为详细。
  
 17、example()：假设有一个函数foo，example("foo")，函数foo的使用示例。
  
 18、apropos()：列出名称中含有foo的所有可用函数。apropos("foo",mode="function")。
  
 19、data()：列出当前已加载包中所含的所有可用示例数据集。
  
 20、ls()：列出当前工作空间中的对象。
  
 21、rm()：移除（删除）一个或多个对象。
  
 22、history(#)：显示最近使用过的#个命令（默认值为25）。
  
 23、options()：显示或设置当前选项。有一个收藏文件有介绍options的功能。
  
 24、boxplot()：生成盒型图。
  
 25、sum()：计算和。sum(x,na.rm = TRUE)。
  
 26、median()：计算中位数。
  
 27、cbind()：以列结合变量。cbind(x,y,z)。
  
 28、rbind()：以行结合变量。
  
 29、vector()：以向量形式结合数据。vector(length = 10)。
  
 30、rep()：以矩阵形式结合数据。rep(c(1,,2,3),each = 10)
  
 31、seq()：生成一个有序的数列。seq(1,10)。
  
 32、dim()：矩阵或者cbind输出的维数。dim(Mydata)。
  
 33、scan()：从ascii文件中读取数据。scan(file = "test.txt")。
  
 34、write.table()：把一个变量写入到ascii文件。write.table(Z,file = "test.txt")。
  
 35、order()：确定数据的顺序。order(x)。
  
 36、merge()：合并两个数据框。merge(x,y,by = "ID")。
  
 37、str()：显示一个对象的内部结构。str(Mydata)。
  
 38、factor()：定义变量作为因子。factor(x)。
  
 39、tapply()：tapply(X = Veg$R,INDEX = Veg$Transect,FUN = mean).tapply函数根据第二个变量(Transect)的不同水平对第一变量(R)进行了求平均值运算。还可以求sd，var，length等操作。R语言初学者指南P75详细介绍了这个函数。
  
 40、下一页介绍了sapply和lapply。
  
 41、summary()：计算基本信息。
  
 42、table()：计算列联表，统计因子各水平的出现次数(频数或频率)。table(x,y)。
  
 43、plot()：y对x的图形。pch形状，col颜色。
  
 44、par()：par(mfrow = c(2,2),mar = c(3,3,2,1))
  
 mfrow生成一个具有4个面板的图形窗口。mar选项指定每个图形周围空白的大小，底部、左侧、顶部、右侧。
  
 45、paste()：将变量连接成字符串。paste("a","b",sep = "")。
  
 46、log()： log = "x",log = "y",log = "xy",生成对数轴。
  
 47、%in%：
  
 a<-c(1,3,13,1443,43,43,4,34,3,4,3)
  
 b<-c(1,13,11,1313,434,1)
  
 a%in%b
  
 # 返回内容# 
  
 [1]  TRUE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
  
 # 取反操作
  
 !(a%in%b)
  
 48、sort()函数是对向量进行从小到大的排序
  
 　　rank()函数返回的是对向量中每个数值对应的秩
  
 　　order()函数返回的值表示位置，依次对应的是向量的最小值、次小值、第三小值……最大值等（位置索引）
  
 　　arrange()函数（需加载dplyr包）针对数据框，返回基于某列排序后的数据框，方便多重依据排序。
  
 49、subset()： df <- data.frame( a = 1:10, b = 2:11, c = 3:12 ) 
  
 df <- subset(df, select = c(a,c)) #选取列a和c
  
 df <- subset(df, select = -c(a,c) ) #去除列a和c

R语言基础知识笔记

2. R语言求解答，谢谢。

原假设：沙门氏菌的平均水平mu<=0.3MPN/g

对立假设：沙门氏菌的平均水平mu>0.3MPN/g
设向量
>vec<-c(0.593,0.142,0.329,0.691,0.231,0.793,0.519,0.392,0.418)
用t检验
>t.test(vec,mu=0.3,alternative="greater",conf.level=0.01)
t.test 是t检验
括号里第一个参数vec是检验的数据
mu=0.3 是检验均值
alternative="greater" 对立假设是大于号
conf.level=0.01 置信水平α=0.01


结果是

One Sample t-test

data:  vec 
t = 2.2051, df = 8, p-value = 0.02927
alternative hypothesis: true mean is greater than 0.3 
1 percent confidence interval:
 0.6619424       Inf 
sample estimates:
mean of x 
0.4564444 

p-value = 0.02927>0.01 不能否定原假设 在置信水平α=0.01的情况下。
但是在α=0.05的情况下，就可以否定原假设，认为冰激凌中的沙门氏菌超出警戒水平0.3MPN/g

3. 「R语言简介」第一讲基本介绍

「R语言简介」第一讲基本介绍

4. R语言初学者指南的内容简介

作者阿兰·F·祖尔等的基于他们对应用科学家讲授统计与R的丰富经验，为读者献上了《R语言初学者指南》这本书。为了避免同时讲授R与统计的困难，统计方法保持在最低限度。《R语言初学者指南》包括如何下载与安装R，载入和处理数据，基本绘图，函数简介，高级绘图以及初学者常见的错误。这本书包括了你开始学习R时想知道的所有内容。

5. R语言的介绍

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。

R语言的介绍

6. R的R语言

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。R 是统计领域广泛使用的诞生于1980年左右的 S 语言的一个分支。R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件，它基于S语言，并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处，两个软件有一定的兼容性。S-PLUS的使用手册，只要经过不多的修改就能成为 R的使用手册。所以有人说：R，是S-PLUS的一个“克隆”。但是请不要忘了：R is free。R是一套完整的数据处理、计算和制图软件系统。其功能包括：数据存储和处理系统；数组运算工具（其向量、矩阵运算方面功能尤其强大）；完整连贯的统计分析工具；优秀的统计制图功能；简便而强大的编程语言：可操纵数据的输入和输出，可实现分支、循环，用户可自定义功能。与其说R是一种统计软件，还不如说R是一种数学计算的环境，因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是：它可以提供一些集成的统计工具，但更大量的是它提供各种数学计算、统计计算的函数，从而使使用者能灵活机动的进行数据分析，甚至创造出符合需要的新的统计计算方法。该语言的语法表面上类似 C，但在语义上是函数设计语言的（functional programming language）的变种并且和Lisp 以及 APL有很强的兼容性。特别的是，它允许在“语言上计算”（computing on the language）。这使得它可以把表达式作为函数的输入参数，而这种做法对统计模拟和绘图非常有用。R是一个免费的自由软件，它有UNIX、LINUX、MacOS和WINDOWS版本，都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块，其他外在模块可以通过CRAN获得。

7. r语言教程是什么？

R语言教程是指导使用R语言的手册，用于统计分析，图形表示和报告的编程语言和软件环境。
R语言由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学创建，目前由R语言开发核心团队开发。R语言在GNU通用公共许可证下免费提供，并为各种操作系统（如Linux，Windows和Mac）提供预编译的二进制版本。
这种编程语言被命名为R语言，基于两个R语言作者的名字的第一个字母（Robert Gentleman和Ross Ihaka），并且部分是贝尔实验室语言S的名称。

扩展资料
适用人群
本教程是为期待使用R编程开发统计软件的软件程序员，统计学家和数据挖掘者设计的。如果你试图理解R编程语言作为一个初学者，本教程将给你足够的了解语言的几乎所有的概念，从那里你可以把自己的更高水平的专业知识。
学习前提
在继续学习本教程之前，您应该基本了解计算机编程术语。对任何编程语言的基本理解将帮助您理解R语言编程概念，并在学习轨道上快速移动。

r语言教程是什么？

8. 什么是r语言

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。
发展历史
R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件，它基于S语言，并由MathSoft公司的统计科学部进一步完善。后来新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统。由“R开发核心团队”负责开发。R可以看作贝尔实验室（AT&T BellLaboratories）的RickBecker，JohnChambers和AllanWilks开发的S语言的一种实现。当然,S语言也是S-Plus的基础。所以,两者在程序语法上可以说是几乎一样的,可能只是在函数方面有细微差别,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能运用于R。
R语言的特点
R作为一种统计分析软件，是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上，而且嵌入了一个非常方便实用的帮助系统，相比于其他统计分析软件，R还有以下特点：
1.R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。
2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。
3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有：base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.
4.R具有很强的互动性。除了图形输出是在另外的窗口处，它的输入输出窗口都是在同一个窗口进行的，输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。
5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地. 
R是基于S语言的一个GNU项目，所以也可以当作S语言的一种实现，通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处，这两种语言有一定的兼容性。S-PLUS的使用手册，只要稍加修改就可作为R的使用手册。所以有人说：R，是S-PLUS的一个“克隆”。
但是请不要忘了：R是免费的。R语言源代码托管在github，具体地址可以看参考资料。
R语言的下载可以通过CRAN的镜像来查找。
R语言有域名为.cn的下载地址，有六个，其中两个由Datagurn，由中国科学技术大学提供的。R语言Windows版，其中由两个下载地点是Datagurn和USTC提供的。

R语言基础知识笔记

1. R语言基础知识笔记

2. R语言 求解答，谢谢。

3. 「R语言简介」第一讲基本介绍

4. R语言初学者指南的内容简介

5. R语言的介绍

6. R的R语言

7. r语言教程是什么？

8. 什么是r语言

2. R语言求解答，谢谢。