首页

85问答库 > python抓取网页中文信息

python抓取网页中文信息

2025-06-29 04:01:56

推荐回答（1个）

回答1：

# -*- coding:utf-8 -*-
import urllib
import re
# 使用正则表达式限定抓取的网页地址
regex = r'pat = re.compile(regex)
page = 1
url = "

info = urllib.urlopen(url).read()
Sub_pages = re.findall(pat,info)
# 获得网址中所有产品信息
regex = r'(.+?) '
pat = re.compile(regex)
for page in Sub_pages:
    content = urllib.urlopen(page).read()
    info = re.findall(pat,content)
    print '\n'.join(info)#改成这样试试

相关问答

最新问答

为什么我爱她，她却总是说没办法接受我！

Sky和MOON谁更强？

The pen I _______ I _______is on my desk, right under my nose. A．think; lost B．thought; had.

小时候打激素现在又高又胖但是身体素质很差老爱生病，该怎么办

漳州博爱医院的医院荣誉

京山春风客运站的京荆直达车是到达荆州的哪个车站？在荆州的那个车站下车后，怎么坐公汽去西门中学？急急

想做黄金外汇代理商，哪个平台比较好？

塘沽一职专今年的升学率和对外经济贸易学院分数线。

c语言课程设计编程习题

我和家人之间有和，我应该如何？