当前位置: 首页 > news >正文

怎么做网站导航外链做企业网站用php

怎么做网站导航外链,做企业网站用php,国外网页素材网站,搜云seo网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~ 效果如图: 源码与所需的依赖: pip install requests pip install requests beautifulsoup4…

网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~

 效果如图:

源码与所需的依赖:

pip install requests
pip install requests beautifulsoup4 lxml 
requests.packages.urllib3.disable_warnings()
pip install urllib3
pip install pyOpenSSL requests[security] urllib3[secure]
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup# 配置requests,不验证SSL证书
requests.packages.urllib3.disable_warnings()
session = requests.Session()
session.verify = False  # 不推荐,仅用于测试目的def sanitize_filename(filename):return "".join(i for i in filename if i not in "\/:*?<>|").split('?')[0]def ensure_dir(file_path):if file_path:directory = os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r = session.get(url, stream=True)r.raise_for_status()ensure_dir(local_path)with open(local_path, 'wb') as f:for chunk in r.iter_content(chunk_size=8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(f"Error downloading {url}: {e}")return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources = soup.find_all(tag, {attribute: True})for resource in resources:old_url = resource[attribute]new_url = urljoin(base_url, old_url)local_filename = sanitize_filename(new_url.split('/')[-1])local_path = os.path.join(dest_folder, sub_folder, local_filename)full_local_path = os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] = os.path.join(sub_folder, local_filename).replace('\\', '/')def save_complete_webpage(url, dest_folder):response = session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding = response.apparent_encodingsoup = BeautifulSoup(response.content, 'html.parser', from_encoding=response.encoding)base_url = urlupdate_resource_links(soup, 'img', 'src', base_url, dest_folder, 'images')update_resource_links(soup, 'link', 'href', base_url, dest_folder, 'css')update_resource_links(soup, 'script', 'src', base_url, dest_folder, 'js')ensure_dir(os.path.join(dest_folder, 'index.html'))with open(os.path.join(dest_folder, 'index.html'), 'w', encoding=response.encoding) as file:file.write(soup.prettify())if __name__ == "__main__":timestamp = str(int(time.time()))[-5:]  # 获取当前时间戳的最后5位数字target_url = input("请输入网址:")  # 目标网址destination_folder = f'downloaded_website_{timestamp}'  # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f"已完整,保存到{destination_folder}文件夹中")

 

http://www.bjxfkj.com.cn/article/107579.html

相关文章:

  • 做网站英文怎么写厦门seo顾问
  • 石家庄市做网站济宁seo
  • 设计网站网站名称宁波网站推广联系方式
  • 开个小网站要怎么做万州区最新消息
  • 网站开发费用计入什么二级科目江西赣鄂皖路桥投资有限公司网站建设
  • 网站推广页面设计wordpress ghostjs
  • 好学校平台网站模板小程序开发平台到底哪家好
  • 做绿色产品的网站做网站一般需要哪些文件夹?
  • 建设银行E路航如何自动进入网站php一键建站
  • 怎样免费做书画网站建立网站需要备案吗
  • 网站建设与管理实训课程wordpress与商城
  • 中山网站优化wordpress 关键词设置
  • 中山市住房建设局网站加强网站建设 通知
  • 网站页面设计最宽可做多宽网站优化搜索排名
  • 在线做ppt模板下载网站wordpress主题 html5模板
  • 做网站怎么租个域名产品开发计划书
  • 阳江网站建设会议网站建设方案模板
  • 网站备案后可以改名吗网站全背景做多大
  • 山东网站建设公司哪家专业企业文化标语经典
  • 上海网站制作优化网站推广服务好公司排名
  • 网站网站制作网旅游最新资讯 新闻
  • 如何登陆建设银行信用卡网站制作微信公众号
  • 罗平县建设局网站网站模板下载模板下载安装
  • 郑州高端网站制作团队网站优化与SEO区别
  • 深圳网站设计公司发展历程免费网页设计制作网站
  • 网站设计公司苏州网上商城开发网站建设
  • 枣庄手机网站制作做图表的网站
  • 视频网站建设wordpress 后台设置
  • 免费建设手机网站忻州网站建设求职简历
  • 网站开发模板worddjango网站开发过程