Python从零单排二:数据结构高级特性

@高效码农  March 25, 2019

数据结构高级特性

![avatar](数据结构高级特性.png)

1. 切片

1.1 [x:y] : 返回从x到y-1的切片对象
>>> L = list(range(100))
>>> L[0:5]
[0, 1, 2, 3, 4]
注意:L[0:5]表示:从索引0开始取,直到索引5为止,但不包括索引5。
  • 如果第一个索引是0,还可以省略:

    >>> L[:3]
    [0, 1, 2]
  • 支持 负数 切片

    >>> L[-2:]
    [98, 99]
    >>> L[-2:0]
    []
    >>> L[-2:1]
    []
    >>> L[-2:-1]
    [98]
    >>> L[0:-98]
    [0, 1]
1.2 [:] : 切取全部元素
>>> L[:]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
1.3 [x:y:n] : 从x到y-1,每n个取一个制作切片
>>> L[0:20:2]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
>>> L[0:20:-2]
[]
>>> L[0:20:-1]
[]
>>> L[0:-20:-1]
[]
>>> L[0:-20:10]
[0, 10, 20, 30, 40, 50, 60, 70]
>>> L[-1:-20:2]
[]
>>> L[-1:-20:-2]
[99, 97, 95, 93, 91, 89, 87, 85, 83, 81]

L[n1:n2:n3] :

n1代表开始元素下标,不写就是从头,这个要看n3的符号,n3是负的,那就是从最右边,正,从最左边。

n2代表结束元素下标,不写就是到结束,同上

n3代表切片间隔以及切片方向,不写就是默认1 ,如-2 表示:切片从后往前,间隔为2

L中每个元素都有正负两种下标,正数从L[0]开始,表示第一个元素。倒数L[-1]表示倒数第一个元素。L[0]和L[-100]指的同一个元素都是0

无论L[0]还是L[-100] ,我觉得可以这么理解:你先把负数转换成正数。

比如:L[0:-2:2] 表示:从index=0的元素,到第(10-2)即index=8的元素。正切片,每隔2个。

2.迭代

  • list 迭代

    >>> L = list(range(3))
    >>> L
    [0, 1, 2]
    >>> for n in L:
    ...     print(n)
    ... 
    0
    1
    2
    >>> 

    如果要对list实现类似Java那样的下标循环,可以用enumerate函数把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身

    >>> for i, value in enumerate(L):
    ...     print(i, value)
    ... 
    0 0
    1 1
    2 2
  • dict 迭代

    >>> d = {'a': 1, 'b': 2, 'c': 3}
    >>> d
    {'a': 1, 'b': 2, 'c': 3}
    >>> for k in d:
    ...     print(k)
    ... 
    a
    b
    c
    >>> for k,v in d.items():
    ...     print(k,v)
    ... 
    a 1
    b 2
    c 3
    dict的存储不是按照list的方式顺序排列,所以,迭代出的结果顺序很可能不一样。
  • 通过collections模块的Iterable判断一个对象是可迭代

    >>> from collections import Iterable
    >>> isinstance(L, Iterable)
    True
    >>> isinstance(d, Iterable)
    True

3. 列表生成式

列表生成式是Python内置的非常简单却强大的可以用来创建list的生成式。

>>> list(range(1, 11))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

range() 函数可创建一个整数列表,一般用在 for 循环中。range()函数返回的是整数序列对象,不是列表。

  • 替代循环

    >>> [x * x for x in range(1, 11)]
    [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
  • 双层循环

    >>> [x + y for x in 'ABC' for y in 'CBA']
    ['AC', 'AB', 'AA', 'BC', 'BB', 'BA', 'CC', 'CB', 'CA']
  • 循环判断

    >>> [x for x in range(1, 11) if x % 2 == 0]
    [2, 4, 6, 8, 10]

4. 生成器:generator

一边循环一边计算的机制,称为生成器。

>>> L = [x * x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> 
>>> 
>>> g = (x * x for x  in range(10))
>>> g
<generator object <genexpr> at 0x10e5fc480>

L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。

打印generator
>>> g = (x * x for x  in range(10))
>>> g
<generator object <genexpr> at 0x10e5fc480>
>>> for n in g:
...     print(n)
... 
0
1
4
9
16
25
36
49
64
81

用生成器(generator)实现斐波拉契数列 见(fib.py)结果如下:

普通实现:
1
1
2
3
5
8
generator实现:
1
1
2
3
5
8
如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator

5. 迭代器

可以直接作用于for循环的数据类型有以下几种:

  • 集合数据类型,如list、tuple、dict、set、str等;
  • generator,包括生成器和带yield的generator function

这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。

  • 可以使用isinstance()判断一个对象是否是Iterable对象
  • 可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator。


评论已关闭