python和r数据分析哪个更好

墨阳伯爵 2015-09-02 12:22:33 394 浏览

参与评论

登录后参与评论

全部评论(3条)

mmjr 2018-08-03 00:00:00

R是统计分析的专用语言。Python是一门通用语言，应用领域更广。如果专注数据分析，挖掘选用哪个差别不大，如果除了数据处理，还涉及到其他开发，则只能选Python了

赞(11)

回复(0)

评论

评论
登录后参与评论
Jane0218 2017-01-14 00:00:00

、K均值聚类 K-Means算法思想简单，效果却很好，是Z有名的聚类算法。聚类算法的步骤如下： 1：初始化K个样本作为初始聚类ZX； 2：计算每个样本点到K个ZX的距离，选择Z近的ZX作为其分类，直到所有样本点分类完毕； 3：分别计算K个类中所...

赞(14)

回复(0)

评论

评论
登录后参与评论
陌殇0420 2015-09-03 00:00:00

2012年的时候我们说R是学术界的主流，但是现在Python正在慢慢取代R在学术界的地位。不知道是不是因为大数据时代的到来。 Python与R相比速度要快。Python可以直接处理上G的数据；R不行，R分析数据时需要先通过数据库把大数据转化为小数据（通过groupby）才能交给R做分析，因此R不可能直接分析行为详单，只能分析统计结果。所以有人说：Python=R+SQL/Hive，并不是没有道理的。 Python的一个Z明显的优势在于其胶水语言的特性，很多书里也都会提到这一点，一些底层用C写的算法封装在Python包里后性能非常GX (Python的数据挖掘包Orange canve 中的决策树分析50万用户10秒出结果，用R几个小时也出不来，8G内存全部占满)。但是，凡事都不，如果R矢量化编程做得好的话（有点小难度），会使R的速度和程序的长度都有显著性提升。 R的优势在于有包罗万象的统计函数可以调用，特别是在时间序列分析方面，无论是经典还是前沿的方法都有相应的包直接使用。相比之下，Python之前在这方面贫乏不少。但是，现在Python有了 pandas。pandas提供了一组标准的时间序列处理工具和数据算法。因此，你可以GX处理非常大的时间序列，轻松地进行切片/切块、聚合、对定期 /不定期的时间序列进行重采样等。可能你已经猜到了，这些工具中大部分都对金融和经济数据尤为有用，但你当然也可以用它们来分析服务器日志数据。于是，近年来，由于Python有不断改良的库（主要是pandas），使其成为数据处理任务的一大替代方案。做过几个实验： 1. 用python实现了一个统计方法，其中用到了ctypes，multiprocess。之后一个项目要做方法比较，又用回R，发现一些bioconductor上的包已经默认用parallel了。（但那个包还是很慢，一下子把所有线程都用掉了，导致整个电脑使用不能，看网页非常卡~） 2. 用python pandas做了一些数据整理工作，类似数据库，两三个表来回查、匹配。感觉还是很方便的。虽然这些工作R也能做，但估计会慢点，毕竟几十万行的条目了。 3. 用python matplotlib画图。pyplot作图的方式和R差异很大，R是一条命令画点东西，pylot是准备好了以后一起出来。pyplot的颜色选择有点尴尬，默认颜色比较少，之后可用html的颜色，但是名字太长了~。pyplot 的legend比R 好用多了，算是半自动化了。pyplot画出来后可以自由拉升缩放，然后再保存为图片，这点比R好用。总的来说Python是一套比较平衡的语言，各方面都可以，无论是对其他语言的调用，和数据源的连接、读取，对系统的操作，还是正则表达和文字处理，Python都有着明显优势。而R是在统计方面比较突出。但是数据分析其实不仅仅是统计，前期的数据收集，数据处理，数据抽样，数据聚类，以及比较复杂的数据挖掘算法，数据建模等等这些任务，只要是100M以上的数据，R都很难胜任，但是Python却基本胜任。结合其在通用编程方面的强大实力，我们完全可以只使用Python这一种语言去构建以数据为ZX的应用程序。但世上本没有Z好的软件或程序，也鲜有人能把单一语言挖掘运用到ji致。尤其是很多人早先学了R，现在完全不用又舍不得，所以对于想要学以致用的人来说，如果能把R和Python相结合，就更好不过了。

赞(20)

回复(0)

评论

评论
登录后参与评论

热门问答

python和r数据分析哪个更好:

python 数据分析用什么软件:

为什么有了SAS，WEKA等功能强大的数据分析挖掘软件，还需要R，PYTHON:

利用python进行数据分析用什么软件:

利用python进行数据分析使用什么软件:

数据分析（SPSS或R软件都可以）: 一个启动效应的实验，实验采用了两种背景的被试（A和B），实验中fixedeffect是C，D和E，random是被试和item（由于启动效应中的target是随机选定的，所以by-item和by-subject应该都需要... 一个启动效应的实验，实验采用了两种背景的被试（A和B），实验中fixed effect是C，D和E，random是被试和item（由于启动效应中的target是随机选定的，所以by-item和by-subject应该都需要分析），分析fixed effect对于反应时间和准确度的影响。想问一下用linear mixed effect model在SPSS（或者R软件）中应该怎样实现？请尽量详细一点，尤其是repeated那个选项是否是指fixed effect？谢谢：）展开

承德软件开发 Python和Ruby哪个就业好:

精油和原液哪个更好？: 我17岁，是干性皮肤，脸颊两边有点黑斑，应该是晒出来的吧，因为14岁之前都没有我在网上搜罗了一下，看见UNES的原液和羞花的精油都还可以，而且好像都是国产的。请教一下，哪个吸收更好，使用方法更简单，效果更好呢？我主要就是想祛斑和变白点，没其他过高... 我17岁，是干性皮肤，脸颊两边有点黑斑，应该是晒出来的吧，因为14岁之前都没有我在网上搜罗了一下，看见UNES的原液和羞花的精油都还可以，而且好像都是国产的。请教一下，哪个吸收更好，使用方法更简单，效果更好呢？我主要就是想祛斑和变白点，没其他过高的要求了~~ 请教用过这两种产品或者深知的ZS人士解答！我适合用什么。谢谢谢谢，展开

the saem 和innisfree哪个更好?:

计量泵和蠕动泵哪个更好:

注塑机和数控车床哪个更好:

python网络数据采集用python写网络爬虫哪个好:

铝和铜哪个导热性能更好，哪个恒温较果更好？:

玻璃棉和矿棉哪个效果更好:

机械加工和焊接哪个更好一些:

硅胶管和乳胶管哪个气密性更好:

硅胶管和乳胶管哪个气密性更好:

3m砂纸和勇士哪个更好，，，:

生物酶和光触媒除甲醛哪个更好？:

python和r数据分析哪个更好

联系我们

关注我们