Julia和Python是两种时下流行的机器学习编程语言。本文将从实际应用的角度为您比较两者之间的差别。

长期以来,Python一直是程序员、乃至其他专业人士最喜欢的编程语言之一。Facebook、Instagram、Spotify、Netflix、ILM、Dropbox、Yahoo!和Google都在其应用服务中使用着Python。

不过,随着应用业务对于数据操作和科学计算需求的持续增加,人们往往需要依赖一种更加高效的数据处理语言。为此,Alan Edelman、Viral B. Shah、Jeff Bezanson和Stefan Karpinski于2021年开发出了Julia。它在算术编程(arithmetic coding)方面可以作为Python的绝佳替代品,协助进行各项数据处理工作。目前,Julia已经成为了数据科学、可视化、机器学习、以及人工智能领域重要的工具之一。

Julia的特点

为了解决Python等语言在数据处理等应用场景中的科学计算能力不足等问题。Julia在开发之初就被设计为旨在是使用LLVM(Low Level Virtual Machine)编译器框架所构建的即时编译器(just-in-time,JIT),来提高运行时的性能。在最好的情况下,Julia会在编译而不是在解释时,可以达到、甚至超过C语言的性能。

Julia的交互式命令行类似于Python的REPL(read-eval-print loop,读取-评估-打印循环)。各种一次性使用的脚本和命令可以被立即插入其中。同时,Julia有着与Python类似的、简短且有效的语法。

Julia可以直接与第三方的C和Fortran库进行通信。您可以使用PyCall模块作为Python程序的接口,并在Python和Julia之间传输数据。

Julia能够以一种类似于Lisp(List Processing,一种早期自由软件项目)语言的方式,生成应用程序,甚至去编辑它们的代码。在Julia 1.1中被引入的调试套件,则使得您能够在本地REPL中,遍历代码的执行结果,检查变量,以及将断点应用到代码中。例如,逐个代码执行的函数可以去执行各种细粒度的任务。

Python的特点

近年来,经典且全面的Python持续与大量第三方程序保持着密切的联系。虽然Python当初并非针对数据科学家而设计,但是它已经被运用到了该领域。由于Python模块能够简化特殊算法的创建,因此许多数据科学家和机器学习专业人士,都会使用Python进行情感分析和自然语言处理(natural language processing,NLP)。

由于属于一种解释型语言,因此Python的代码并不需要经历编译的过程。它不但开源而且可以被免费下载。Python能够支持所有面向对象的概念,其中包括:类、多态性、以及封装等。由于本身具有可扩展性,因此Python代码可以用C或C++进行编写和编译。

Python属于一种易于学习和编写的高级编程语言。通过导入预先存在的Python库,开发人员可以不必重新输入相同的数据,进而节省了开发时间。其逐行顺序执行的方式简化了调试过程。而在运行时,Python变量的数据类型则取决于它的用途,而并非其声明。

而作为一种面向对象的解释性编程语言,Python在动态类型、高级数据结构、以及动态绑定等方面具有较强的适应性,程序员仅通过几行代码,便可创建出动态的程序。因此,Python的流行和使用都非常广泛。

Python的主要弱点是处理速度较慢。当然,Python对此也在持续改进中。其新的、简化了的PyPy 7.1解释器就在速度上提升了不少。此外,Python正在通过并行和多核计算进行速度上的提升。

Julia与Python的全面比较

1.专为机器学习而设计

Python可被用于执行各项应用活动。而Julia的设计则主要考虑的是机器学习和统计工作的负载。

a) Julia具有在高级统计方面的显著优势;而Python不一定能够处理机器学习中用到的所有方程和矩阵。例如,在线性代数方面,“vanilla”Julia的表现就明显优于“vanilla”Python。

b) Julia在非包(non-package)体验方面优于Python,更适合机器学习类计算;当然作为一门优秀的语言,Python也可以通过NumPy(一种开源的Python数值计算扩展)来存储和处理大型矩阵。

c) Julia的操作数系统(operand system)与用于统计分析、绘图的R语言操作环境旗鼓相当。而Python在操作计算方面的性能劣势较为明显。

2.速度

a) Julia的性能与速度可与Fortran和C等编译性语言相媲美。不过,Julia并非解释型语言,它主要依赖类型声明,来执行那些需要在运行时编译的程序。

b) 开发人员可以使用Julia来实现高性能的应用,而无需借助手动分析和优化方法。这对性能问题的解决,十分有利。

c) 凭借着丰富的计算和数值特征,Julia的程序执行效率很高。此外,它还具有多重分派能力,可以快速地开发出数组和整数等数据类型。

d) Python开发人员(https://skillsstreet.com/python-developer-skills/)正在通过优化工具、第三方JIT编译器、以及外部库来进一步提高Python的速度。

3.在数据科学中的应用

a) 如前所述,Python可被用于各种目的,数据分析只是其中的一项关键性应用。

b) 由于Python包括了能够轻松、快速地进行数据分析和处理的应用程序、工具和库,因此它成为了数据科学中最受欢迎的工具之一。

c) 为了满足日益增长的针对数据分析和程序执行任务的需求,开发者会将Julia应用到科学计算、大规模线性代数、机器学习、并行和分布式计算等场景中。

d) Julia增强了Python的性能,使得数据科学家能够轻松地执行计算和分析。

4.多功能性

a) Julia能够让数据科学家运用各种语言去开发项目,并通过字符串的传输进行构建。

b) 作为一种适应性非常强的编程语言,Julia可以在LaTeX、C、Python和R语言中生成可执行的代码。此外,它在执行复杂且大型的代码段时的速度也比Python快。

c) 鉴于Julia的封装劣势,您可以通过RCall和PyCall,按需调用R和Python。

d) 作为通用可靠语言的最佳选择,Python可用于Web开发、自动化和脚本的编写。

5.文档和社区支持

a) 每种编程语言都离不开工具的支持。经过几十年的发展,Python已拥有了庞大且活跃的互助性编程社区。此类社区不但能够通过持续改进,向开发人员提供各种工具支持、用户界面和系统资源,而且能够确保各种显著的程序问题,能够得到足够的关注。

b) 作为一种新兴的编程语言,Julia的社区支持仍处于起步阶段,目前尚不支持各种主要资源和调试工具。当然,其社区也正在变得日渐活跃起来。

结论

综上所述,Julia有着更快的处理速度和易于代码翻译的特点,当然它也需要进一步开发与完善。而Python虽然在性能方面有待改进,但是它仍然是程序员、数据科学家和学生的首选语言。不过,如果您正在从事需要大量数学计算的项目的话,那么我推荐您选择使用Julia语言。

译者介绍

陈峻 (Julian Chen),51CTO社区编辑,具有十多年的IT项目实施经验,善于对内外部资源与风险实施管控,专注传播网络与信息安全知识与经验;持续以博文、专题和译文等形式,分享前沿技术与新知;经常以线上、线下等方式,开展信息安全类培训与授课。

原文标题:Julia vs. Python: Key Differences To Consider,作者:sai kumar