
会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
最新上架
- 会员
Python编程:从入门到实践(第3版)
本书是享誉全球的Python入门书,影响了超过250万读者。全书分两部分:第一部分介绍用Python编程所必须了解的基本概念,包括强大的Python库和工具,以及列表、字典、if语句、类、文件和异常、代码测试等内容;第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的2D游戏、利用数据生成交互式的信息图以及创建和定制简单的Web应用,并帮助读者解决常见编程问题和困惑。第3版进行了全面修订:使用计算机24.2万字 - 会员
iOS自动化测试实战:基于Appium、Python与Pytest
本书主要介绍iOS自动化测试的相关内容。本书首先介绍iOS基础知识;接着介绍测试环境部署、Appium基本操作和Appium终端操作,为读者学习后面的知识打下基础;然后介绍Appium中的元素定位、元素操作、高级操作、等待机制;最后讲述Pytest测试框架、项目实战、项目代码优化、自动化测试框架开发等。本书适合测试人员和开发人员阅读。计算机8.7万字 - 会员
MATLAB GUI纯代码编写从入门到实战
本书介绍如何使用代码(.m与.mlx文件)开发图形用户界面(GUI),辅以大量的编程示例详细讲解基于figure函数的uicontrol、容器、坐标区、常用控件、图窗工具、检测控件、对话框和通知,基于uifigure函数的对话框和通知,以及布局函数、控制流函数、App数据和预设函数等内容。与采用GUIDE、AppDesigner的方式相比,用代码开发的GUI能兼容几乎所有的MATLAB版本,灵活计算机9.2万字 - 会员
Spring Boot 3:入门与应用实战
随着JDK的升级与迭代,SpringFramework与SpringBoot也分别升级到了全新的6.0与3.0版本,全新的版本带来了更加强大的功能和特性。本书侧重于核心功能和特性的讲解,重点讲解SpringFramework与SpringBoot在应用开发中的核心与应用,通过多个方面介绍应用开发中涉及的场景。本书分为六个部分,共15章。第一部分~第三部分介绍SpringFramework计算机21.5万字 - 会员
Python物理建模初学者指南(第2版)
本书介绍了如何使用Python语言进行物理建模,包括完成二维和三维图形绘制、动态可视化、蒙特卡罗模拟、常微分方程求解、图像处理等常见任务。本书在第1版的基础上增加了关于用SymPy进行符号计算的新内容,介绍了用于数据科学和机器学习的pandas和sklearn库、关于Python类和面向对象编程的入门知识、命令行工具,以及如何使用Git进行版本控制。本书适合对科学计算感兴趣、想要使用Python完计算机14万字 - 会员
微信小程序开发
本书介绍了小程序的开发语言、框架、能力、调试等内容,可帮助读者快速、全面了解小程序开发的技能细节,达到从入门到熟练应用的学习效果。本书以微信小程序开发的入门基础为主要学习内容,选取了图文显示、布局基础、界面设计、JavaScript基础、组件基础应用、数据库操作等方面的60多个案例,把技能知识的应用渗透于案例设计过程中,并介绍了许多微信小程序前端开发的技能技巧。本书共7个项目,主要内容包括项目1H计算机4.3万字 - 会员
Three.js权威指南:在网页上创建3D图形和动画的方法与实践(原书第4版)
Three.js在过去几年中已经成为创建令人惊叹的3DWebGL内容的标准方式。本书探讨Three.js的所有特性,并提供额外的内容,包括如何将Three.js与Blender、React、TypeScript以及最新的物理引擎进行集成。本书共分为四个部分:第一部分介绍搭建开发环境和运行Three.js;第二部分介绍Three.js的核心组件;第三部分介绍如何创建复杂的几何体、动画和纹理;第四部计算机13.3万字 - 会员
Cursor与Copilot开发实战
本书全面介绍如何利用现有的AI技术辅助编程开发,涵盖从基础工具的使用到企业级项目的全程实战与场景化应用。全书分为三部分,共12章,系统讲解AI辅助编程的应用,逐步深入,为开发者提供详细的实践指导。第一部分介绍Cursor与Copilot的安装、配置和使用技巧,通过前后端开发案例,帮助读者优化代码生成流程,设计高效的UI组件,并利用Prompt引导AI生成所需的代码与文档。第二部分聚焦复杂开发场景,计算机10.6万字 - 会员
Python机器学习之金融风险管理
近年来,人工智能技术得到了快速发展,并在金融风险管理领域逐渐渗透。本书旨在引导读者了解金融风险建模背后的理论,学会在金融风险管理业务中运用Python语言和一系列机器学习模型。本书分为三部分,第一部分(第1~3章)介绍风险管理的基础知识,第二部分(第4~8章)通过一系列案例将机器学习模型运用到市场风险管理、信用风险管理、流动性风险管理和运营风险管理等场景,第三部分(第9章、第10章)讲解如何对其他计算机8.6万字