全部评论(3条)
-
- mmjr 2018-08-03 00:00:00
- R是统计分析的专用语言。Python是一门通用语言,应用领域更广。如果专注数据分析,挖掘选用哪个差别不大,如果除了数据处理,还涉及到其他开发,则只能选Python了
-
赞(11)
回复(0)
-
- Jane0218 2017-01-14 00:00:00
- 、K均值聚类 K-Means算法思想简单,效果却很好,是Z有名的聚类算法。聚类算法的步骤如下: 1:初始化K个样本作为初始聚类ZX; 2:计算每个样本点到K个ZX的距离,选择Z近的ZX作为其分类,直到所有样本点分类完毕; 3:分别计算K个类中所...
-
赞(14)
回复(0)
-
- 陌殇0420 2015-09-03 00:00:00
- 2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。不知道是不是因为大数据时代的到来。 Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=R+SQL/Hive,并不是没有道理的。 Python的一个Z明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常GX (Python的数据挖掘包Orange canve 中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。但是,凡事都不,如果R矢量化编程做得好的话(有点小难度),会 使R的速度和程序的长度都有显著性提升。 R的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。 相比之下,Python之前在这方面贫乏不少。但是,现在Python有了 pandas。pandas提供了一组标准的时间序列处理工具和数据算法。因此,你可以GX处理非常大的时间序列,轻松地进行切片/切块、聚合、对定期 /不定期的时间序列进行重采样等。可能你已经猜到了,这些工具中大部分都对金融和经济数据尤为有用,但你当然也可以用它们来分析服务器日志数据。于是,近 年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大替代方案。 做过几个实验: 1. 用python实现了一个统计方法,其中用到了ctypes,multiprocess。 之后一个项目要做方法比较,又用回R,发现一些bioconductor上的包已经默认用parallel了。(但那个包还是很慢,一下子把所有线程都用掉了,导致整个电脑使用不能,看网页非常卡~) 2. 用python pandas做了一些数据整理工作,类似数据库,两三个表来回查、匹配。感觉还是很方便的。虽然这些工作R也能做,但估计会慢点,毕竟几十万行的条目了。 3. 用python matplotlib画图。pyplot作图的方式和R差异很大,R是一条命令画点东 西,pylot是准备好了以后一起出来。pyplot的颜色选择有点尴尬,默认颜色比较少,之后可用html的颜色,但是名字太长了~。pyplot 的legend比R 好用多了,算是半自动化了。pyplot画出来后可以自由拉升缩放,然后再保存为图片,这点比R好用。 总的来说Python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处 理,Python都有着明显优势。 而R是在统计方面比较突出。但是数据分析其实不仅仅是统计,前期的数据收集,数据处理,数据抽样,数据聚类,以及比较复杂的数据挖掘算法,数据建模等等 这些任务,只要是100M以上的数据,R都很难胜任,但是Python却基本胜任。 结合其在通用编程方面的强大实力,我们完全可以只使用Python这一种语言去构建以数据为ZX的应用程序。 但世上本没有Z好的软件或程序,也鲜有人能把单一语言挖掘运用到ji致。尤其是很多人早先学了R,现在完全不用又舍不得,所以对于想要学以致用的人来说,如果能把R和Python相结合,就更好不过了。
-
赞(20)
回复(0)
热门问答
- python和r数据分析哪个更好
2015-09-02 12:22:33
394
3
- python 数据分析 用什么软件
2016-10-23 00:37:06
286
2
- 为什么有了SAS,WEKA等功能强大的数据分析挖掘软件,还需要R,PYTHON
2018-04-04 09:08:43
265
1
- 利用python进行数据分析 用什么软件
2017-11-10 17:45:43
491
2
- 利用python进行数据分析 使用什么软件
2016-09-17 07:18:19
327
1
- 数据分析(SPSS或R软件都可以)
- 一个启动效应的实验,实验采用了两种背景的被试(A和B),实验中fixedeffect是C,D和E,random是被试和item(由于启动效应中的target是随机选定的,所以by-item和by-subject应该都需要... 一个启动效应的实验,实验采用了两种背景的被试(A和B),实验中fixed effect是C,D和E,random是被试和item(由于启动效应中的target是随机选定的,所以by-item和by-subject应该都需要分析),分析fixed effect对于反应时间和准确度的影响。想问一下用linear mixed effect model在SPSS(或者R软件)中应该怎样实现?请尽量详细一点,尤其是repeated那个选项是否是指fixed effect?谢谢:) 展开
2018-11-11 04:17:22
226
0
- 承德软件开发 Python和Ruby哪个就业好
2018-07-17 01:11:53
566
1
- 精油和原液哪个更好?
- 我17岁,是干性皮肤,脸颊两边有点黑斑,应该是晒出来的吧,因为14岁之前都没有 我在网上搜罗了一下,看见UNES的原液和羞花的精油都还可以,而且好像都是国产的。请教一下,哪个吸收更好,使用方法更简单,效果更好呢? 我主要就是想祛斑和变白点,没其他过高... 我17岁,是干性皮肤,脸颊两边有点黑斑,应该是晒出来的吧,因为14岁之前都没有 我在网上搜罗了一下,看见UNES的原液和羞花的精油都还可以,而且好像都是国产的。请教一下,哪个吸收更好,使用方法更简单,效果更好呢? 我主要就是想祛斑和变白点,没其他过高的要求了~~ 请教用过这两种产品或者深知的ZS人士解答! 我适合用什么。 谢谢 谢谢, 展开
2009-05-15 03:34:27
579
4
- the saem 和innisfree哪个更好?
2014-08-28 19:51:56
288
1
- 计量泵和蠕动泵哪个更好
2012-05-14 19:03:36
591
3
- 注塑机和数控车床哪个更好
2012-06-01 05:36:31
496
3
- python网络数据采集 用python写网络爬虫 哪个好
2016-12-15 07:11:56
379
1
- 铝和铜哪个导热性能更好,哪个恒温较果更好?
2010-11-23 04:01:32
1171
3
- 玻璃棉和矿棉哪个效果更好
2016-11-26 08:43:41
395
1
- 机械加工和焊接哪个更好一些
2011-06-29 01:36:25
324
5
- 硅胶管和乳胶管哪个气密性更好
2017-08-22 22:46:41
286
1
- 硅胶管和乳胶管哪个气密性更好
2016-11-29 09:15:25
363
1
- 3m砂纸和勇士哪个更好,,,
2018-12-07 17:17:23
199
0
- 生物酶和光触媒除甲醛哪个更好?
2017-03-21 11:16:37
342
3
参与评论
登录后参与评论