可以使用的函數:
- strip() ->去除字串兩邊的空白
- lstrip()->去除字串左邊的空白
- rstrip()->去除字串右邊的空白
- replace(' ','')->第一個參數為要替代的字串,要去除空白所以就打一個空白字串
- replace(u'','')->這個是比較特別的空白,通常是在網路爬蟲的時候,有 的html空格,用如上的方式會發現去不掉,所以必須在unicode下做替換使用
>>> temp = " hello Kevin!! "
>>> temp.strip()
'hello Kevin!!'
>>> temp.lstrip()
'hello Kevin!! '
>>> temp.rstrip()
' hello Kevin!!'
>>> temp.replace(' ','')
'helloKevin!!'
--------------------------
r = requests.get(url)
r.encoding = 'unicode'
soup = bf(r.text,'html.parser')
for n,i in enumerate(a.select('tr')[7:],0):
temp = i.text.strip().replace(u'', '')
..
..
..
..
--------------------------
文章標籤
全站熱搜
