一、上节内容补充
集合
集合是一个无序的,不重复的数据组合,它的主要作用如下:
- 去重,把一个列表变成集合,就自动去重了
- 关系测试,测试两组数据之前的交集、差集、并集等关系
一些操作如下:
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 set_1 = set([1,3,5,7,9,2,1,3,5]) 5 set_2 = set([2,4,6,8,10,5,6,9]) 6 7 print(set_1) 8 #{1, 2, 3, 5, 7, 9} 9 print(set_2)10 #{2, 4, 5, 6, 8, 9, 10}11 12 #交集13 print(set_1.intersection(set_2))14 print(set_1 & set_2)15 #{9, 2, 5}16 17 #并集18 print(set_1.union(set_2))19 print(set_1 | set_2)20 #{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}21 22 #差集23 print(set_1.difference(set_2))24 print(set_1 - set_2)25 #{1, 3, 7}26 27 #对称差集(项在set_1或set_2中,但不会同时出现在二者中)28 print(set_1.symmetric_difference(set_2))29 print(set_1 ^ set_2)30 #{1, 3, 4, 6, 7, 8, 10}31 32 #基本操作33 set_1.add(4) #在set_1中添加一项34 print(set_1)35 #{1, 2, 3, 4, 5, 7, 9}36 set_1.update([11,13,15,17,19]) #在set_1中添加多项37 print(set_1)38 #{1, 2, 3, 4, 5, 7, 9, 11, 13, 15, 17, 19}39 40 #使用remove()可以删除一项,如果不存在会报错:41 set_1.remove(2)42 set_1.remove(4)43 print(set_1)44 #{1, 3, 4, 5, 7, 9, 11, 13, 15, 17, 19}45 set_1.discard(100) #在set_1中删除一项,如果不存在则什么事也不干46 print(set_1)47 #{1, 3, 5, 7, 9, 11, 13, 15, 17, 19}48 #set_1.pop() #任意删除一个成员49 #print(set_1)50 #{3, 5, 7, 9, 11, 13, 15, 17, 19}51 52 print(set_1.issubset({1, 3, 5, 7, 9, 11, 13, 15, 17, 19,21})) #判断set_1是不是某个集合的子集53 #True54 55 print({1, 3, 5, 7, 9, 11, 13, 15, 17, 19,21}.issuperset(set_1)) #判断某个集合是不是set_1的父集56 #True57 58 print(len(set_1)) #查看set_1的长度59 #1060 print(1 in set_1) #测试某个元素不是set_1的成员61 #True62 print(1 not in set_1) #测试某个元素不是set_1的成员63 #False64 65 print(set_1.isdisjoint(set_2)) #两个集合没有集合返回True66 #False67 68 new_set = set_1.copy() #浅copy69 print(new_set)70 #{1, 3, 5, 7, 9, 11, 13, 15, 17, 19}71 72 set_1.clear() #清空整个集合73 print(set_1)74 #set()
文件操作
对文件操作流程
- 打开文件,得到文件句柄并赋值给一个变量
- 通过句柄对文件进行操作
- 关闭文件
基本操作
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 f = open("test.txt",'w+',encoding="utf-8") 5 f.write("Hello!") 6 f.flush() #将内容刷进文件 7 f.seek(0) #将光标位置移动至某处 8 print(f.readline()) 9 print(f.tell()) #打印光标位置10 f.seek(0)11 f.write("n") #此时修改会覆盖12 f.close()13 14 15 16 with open("test.txt",'r',encoding="utf-8") as f:17 print(f.encoding) #打印文件编码18 print(f.fileno()) #返回文件句柄编号19 print(f.name) #打印文件名字20 print(f.isatty()) #是不是终端设备21 print(f.seekable()) #22 print(f.readable()) #是否可读23 print(f.writable()) #是否可写24 print(f.closed) #文件是否关闭25 26 with open("test1.txt",'a',encoding="utf-8") as f:27 f.truncate(10) #截断,从头开始截断,不管指针在哪28 29 30 f = open("song.txt",'r+',encoding="utf-8") #读写31 print(f.readline())32 print(f.readline())33 print(f.readline())34 print(f.tell())35 f.write("=================") #只会在文件末尾追加36 f.close()37 38 f = open("test.txt",'w+',encoding="utf-8") #写读39 f.write("===============\n")40 f.write("===============\n")41 f.write("===============\n")42 f.write("===============\n")43 print(f.tell())44 f.seek(0)45 print(f.readline())46 f.write("*****************\n") #只会在文件末尾追加47 f.close()48 49 #f = open("test.txt",'a+',encoding="utf-8") #追加读写50 51 52 #网络传输,二进制文件就用二进制打开53 f = open("test.txt",'rb') #读取二进制文件54 print(f.readline())55 f.close()56 57 f = open("test.txt",'wb') #写二进制文件58 f.write("wwwwww".encode("utf-8"))59 f.close()60 61 62 f = open("test.txt",'ab') #追加二进制文件63 f.write("xxxxxxx".encode("utf-8"))64 f.close()
打开文件的模式有:
- r,只读模式(默认)。
- w,只写模式。【不可读;不存在则创建;存在则删除内容;】
- a,追加模式。【不可读; 不存在则创建;存在则只追加内容;】
"+" 表示可以同时读写某个文件
- r+,可读写文件。【可读;可写;可追加】
- w+,写读
- a+,同a
"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)
- rU
- r+U
"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)
- rb
- wb
- ab
文件修改
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 import sys 5 wt_change = sys.argv[1] 6 change = sys.argv[2] 7 8 with open("song.txt","r",encoding="utf-8") as f1,\ 9 open("new_song.txt","w",encoding="utf-8") as f2:10 for line in f1:11 if wt_change in line:12 line = line.replace(wt_change,change)13 f2.write(line)
小知识点:进度条
1 #!/usr/bin/env python32 # -*- coding: utf-8 -*-3 # Author:Breakering4 import sys,time5 6 for i in range(50):7 sys.stdout.write("=")8 sys.stdout.flush()9 time.sleep(0.1)
字符编码与转码
详细文章:
http://www.cnblogs.com/yuanchenqi/articles/5956943.html
http://www.diveintopython3.net/strings.html
需知:
1.在python2默认编码是ASCII, python3里默认是unicode
2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), so utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf8省空间
3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string
1 #-*-coding:gb2312 -*- #这个也可以去掉 2 # Author:Breakering 3 4 import sys 5 print(sys.getdefaultencoding()) 6 7 8 msg = "我是最棒的" 9 #msg_gb2312 = msg.decode("utf-8").encode("gb2312")10 msg_gb2312 = msg.encode("gb2312") #默认就是unicode,不用再decode,喜大普奔11 gb2312_to_unicode = msg_gb2312.decode("gb2312")12 gb2312_to_utf8 = msg_gb2312.decode("gb2312").encode("utf-8")13 14 print(msg)15 print(msg_gb2312)16 print(gb2312_to_unicode)17 print(gb2312_to_utf8)
二、本节内容
函数
函数是什么?
函数一词来源于数学,但编程中的「函数」概念,与数学中的函数是有很大不同的,具体区别,我们后面会讲,编程中的函数在英文中也有很多不同的叫法。在BASIC中叫做subroutine(子过程或子程序),在Pascal中叫做procedure(过程)和function,在C中只有function,在Java里面叫做method。
定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可
特性:
- 减少重复代码
- 保持一致性
- 代码可扩展
函数的参数:
- 形参变量只有在被调用时才分配内存单元,在调用结束时,即刻释放所分配的内存单元。因此,形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量
- 实参可以是常量、变量、表达式、函数等,无论实参是何种类型的量,在进行函数调用时,它们都必须有确定的值,以便把这些值传送给形参。因此应预先用赋值,输入等办法使参数获得确定值
一些用法:
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 5 def f1(): 6 pass 7 8 def f2(): #定义一个函数 9 pass10 return11 12 def f3(a,b,c): #位置参数13 print(a)14 print(b)15 print(c)16 17 f3(1,2,3)18 19 def f4(a,b=2): #b就是一个默认参数20 print(a)21 print(b)22 23 f4(1,b=3)24 25 #关键参数必须放在位置参数之后26 def f5(a,b,c,d=2):27 pass28 29 f5(1,b=2,c=3,d=3)30 31 32 #参数组33 #*args 接收位置参数,并将传入的参数变成一个元组的形式34 def f6(a,*args):35 print(a)36 print(args)37 38 f6(1,"Breakering",23)39 f6(1,*["Breakering",23])40 41 #*kwargs 接收关键字参数,并将传入的参数变成一个字典的形式42 def f7(a,**kwargs):43 print(a)44 print(kwargs)45 46 f7(1,name="Breakering",age=23)47 f7(1,**{ "name":"Breakering","age":23})
PS:关键参数必须放在位置参数之后
局部变量
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 5 6 name = "Breakering" 7 age = 25 8 9 def change(name):10 global age #声明全局变量后就可以在函数内部修改全局变量11 print("Brfore change:",name,age)12 name = "Profhua" #这个函数就是这个变量的作用域13 age = 2314 print("After change:",name,age)15 16 17 change(name)18 print(name)19 print(age)20 #结果21 # Brfore change: Breakering 2522 # After change: Profhua 2323 # Breakering24 # 2325 26 l = ["Breakering","Profhua","Wolf"]27 28 def change_test(l):29 l[2] = "Dog" #列表、字典、集合以及类在函数内部是可以修改的30 print("inside:",l)31 32 change_test(l)33 print("outside:",l)34 #结果35 # inside: ['Breakering', 'Profhua', 'Dog']36 # outside: ['Breakering', 'Profhua', 'Dog']
全局与局部变量
返回值
要想获取函数的执行结果,就可以用return语句把结果返回
注意:
- 函数在执行过程中只要遇到return语句,就会停止执行并返回结果,so 也可以理解为 return 语句代表着函数的结束
- 如果未在函数中指定return,那这个函数的返回值为None
PS:函数为什么需要返回值,一个重要的作用就是,需要函数的执行结果
递归
在函数内部,可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。
1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 # Author:Breakering 4 5 def calc(n): 6 print(n) 7 if int(n/2) > 0: 8 return calc(n/2) 9 print("----->",n)10 11 calc(100)
递归特性:
1. 必须有一个明确的结束条件
2. 每次进入更深一层递归时,问题规模相比上次递归都应有所减少
3. 递归效率不高,递归层次过多会导致栈溢出(在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出)
高阶函数
将一个函数当作一个参数传给另一个函数,那么这另一个函数就是高阶函数
1 #!/usr/bin/env python32 # -*- coding: utf-8 -*-3 # Author:Breakering4 def add(a,b,f): #将一个函数当作一个参数传给另一个函数,那么这另一个函数就是高阶函数5 return f(a) + f(b)6 7 ret = add(4,-6,abs)8 print(ret)9 #10
函数式编程
参考大王博客:http://www.cnblogs.com/alex3714/articles/5740985.html
三、作业
程序练习
程序1: 实现简单的shell sed替换功能
程序2:修改haproxy配置文件