(编辑:jimmy 日期: 2024/11/12 浏览:2)
python在进行字符串的拼接时,一般有两种方法,一种是使用+直接相加,另一种是使用join
a = "tests" b = "teststs" # 使用 + c = a + b # 使用join c = "".join(a,b)
这两种,其实在性能上具有比较大的差别,当然如果拼接的字符串的个数不多,就感受不到这种差别。
先谈谈这两种拼接方式各自的原理吧。
1. 使用 +
首先需要知道的是,在python中字符串属于不可变对象。
当用操作符+连接字符串的时候,由于字符串是不可变对象,其工作原理实际上是这样的:如果要连接如下字符串:S1+S2+S3+.......+SN,执行一次+操作便会在内存中申请一块新的内存空间,并将上一次操作的结果和本次操作的右操作数复制到新申请的内存空间,即当执行S1+S2的时候会申请一块内存,并将S1、S2复制到该内存中,依次类推,这样就要进行N-1次内存空间的申请了,非常影响效率。
2.使用 join
当使用join时,会一开始就计算出所需要的总的内存空间,也就是说只需要进行一次内存空间的申请,相比 使用 + ,效率提升巨大。
举个栗子
当依次增加字符串的个数,得到如下的时间对比:
不过也确实看出,只有当拼接的字符串个数达到较大级别时,才能被我们人为感知到吧,但是性能优化本来就是在多个地方一点点积累起来的。
总结