当前分类:python>>正文

python用正则表达式提取超链接中的域名

来源:互联网   时间:2022年7月13日   编辑

实际上在上篇文章已经写过一个方法了,使用python官方自带库urllib中的urlparse就可以轻松解决问题。

突然又有个朋友希望我用正则表达式的方式来解决,于是我又写了一个方案。

源码如下:

import re
def get_domain(url):
    regx=re.compile(r'https{,1}://[^/]+/')
    domain=re.search(regx,url)
    if domain==None:
        return None
    else:
        return domain.group()

也就几行代码的事搞定。

我们找了一组网址来测试

然后下面是测试结果

完全没问题的呢。

如果有需要可以直接拿去用,如果有其他的需求,可以自己稍微再改动一下就可以了。

另外一个方法:

使用urlparser提取网址中的域名

哪个易懂好用,就用哪个吧,都差不多!

[猜你喜欢]

标签: 正则表达式 python爬虫