集合
特性:
1.无序性: 一个集合中,每个元素的地位都是相同的,元素之间是无序的
2.互异性: 一个集合中,任何两个元素都是不同的,即元素在集合中只能出现一次
3.确定性: 给定一个集合和一个任意元素,给袁思要么属于这个集合,要么不属于这个集合,二者必居其一,不允许有模棱两可的情况出现。
集合的成员运算在性能上要优于列表的成员 运算,这是集合的底层存储特性(哈希存储)决定的。
创建集合
用set()
创建,或者用 {}
定义一个空集合,但{}
中至少要有一个元素,没有元素就不是空集合而是空字典了。也可以将其他序列转换成集合,例如:set('hello')
会得到一个包含4个字符的集合(重复的l
会被去掉)。还可以用生成式语法来创建集合,和用生成式创建列表一样。要知道集合中有多少个元素,还是使用内置函数len
。使用for
循环可以实现对集合元素的遍历。
|
|
注意:集合中的元素必须是hashable
类型。hashable
类型指的是能够计算出哈希码的数据类型。可以暂时将哈希码理解为和变量对应的唯一的ID值。**通常不可变类型都是hashable
类型。**如整数、浮点、字符串、元组等。而可变类型都不是hashable
类型,因为可变类型无法确定唯一的ID值,所以也就不能放到集合中。集合本身也是可变类型,所以集合不能作为集合中的元素。
集合的运算
python为集合类型提供了非常丰富的运算符,主要包括:成员运算、交集运算、并集运算、差集运算、比较运算(相等性、子集、超集)等。
成员运算
通过成员运算in
、not in
检查元素是否在集合中
|
|
交并差运算
python中的集合跟数学上的集合一样。可以进行交集、并集、差集等运算,而且可以通过运算符和方法调用方式来操作,代码如下。
|
|
总结:对于两个集合求交集,&
运算符和intersection
方法的作用是完全相同的,使用运算符的方式更直观而且代码也比较简短。
比较运算
两个集合可以用==
和!=
进行相等性判断,如果两个集合中的元素完全相同,那么==
比较的结果就是
True
,否则就是False
,如果集合A
中的任意一个元素都是集合B
的元素,那么集合A
称为集合B
的子集。
|
|
集合的方法
python中的集合是可变类型,我们可以通过集合类型的方法为集合添加或删除元素。
|
|
如果要判断两个集合有没有相同的元素可以使用isdisjoint
方法,没有相同元素返回True
,否则返回
False
,代码如下。
|
|
不可变集合
python中还有一种不可变类型的集合,名字叫frozenset
。set
和frozenset
的区别就如同list
跟tuple
的区别。frozenset
由于是不可变类型,能够计算出哈希码,因此它可以作为set
中的元素。除了不能添加和删除元素,frozenset
在其他方面跟set
基本一样。
|
|
总结
python中集合底层使用了哈希存储的方式。集合是一种容器,元素必须是hashable
类型,与列表不同的地方在于集合中元素没有序、不能用索引运算、不能重复。