高效码农

撰写、分享国内外先进的IT技术

分类 Python 下的文章

January 14, 2025

Python操作PDF实例:提取超链接、下载、修改超链接

1、提取 PDF 中的超链接该函数从PDF文件中提取所有链接及其对应的文字: 1.打开PDF文件并遍历每一页。 2.获取每页中的链接信息,检查是否包含URI。 3.提取链接对应的文本,若无则标记为“Unnamed”。 4.将链接的文本、URI、所在页码和矩形位置存入字典,并添加到结果列表中。 5.返回包含所有链接信息的列表。def extract_links_from_pdf(pd...
December 14, 2024

Core ML Tools在Google Colab中使用教程

一、前言Core ML Tools 可以将来自其他框架的训练模型转换为 Core ML 模型的内存表示。此示例演示了如何将使用TensorFlow 的 Keras API训练的图像分类器模型转换为 Core ML 格式。二、如何将Colab的python版本切换为Core ML Tools可用的?1、下载需要的版本!sudo apt-get update -y !sudo apt-get i...
June 21, 2024

宝塔安装PHP7.2和PHP8.1 PHP-FPM重启问题

问题描述宝塔安装了安装PHP7.2和PHP8.1,最近发现服务器内容一直慢慢升高;查看进程发现PHP-FPM 8.1 每隔10分钟重启,重启过程中报错,并且会重新启动2个PHP-FPM 8.1的进程,同时kill掉之前启动2个中的一个进程,所以进程会一直增加,子进程也在一直增加最终导致将内存占满。ERROR: Another FPM instance seems to already lis...
May 31, 2024

如何使用命令行或 Python 在 Mac 上免费使用 OCR

操作步骤如下:在“应用程序”文件夹中打开“快捷方式”应用点击“ + ”按钮创建新的快捷方式在右侧边栏中搜索“提取文本”您应该在可能的操作列表中看到“从图像中提取文本”。将其从右侧边栏拖到左侧的主区域在左侧的“从...中提取文本”操作中,单击淡蓝色的“图像”选择“快捷输入”你会看到一个大大的“从任何地方接收任何输入”操作出现在“从快捷方式输入中提取文本”上方。一切都很好,保持原样在右侧边栏中,...
March 20, 2024

RNN tensorflow 集锦问题汇总

一、建Embeddin层优化1、报错信息:Unrecognized keyword arguments passed to Embedding:{'batch_input_shape': [64, None]}2、模型配置可优化在创建Embedding层时,使用了batch_size作为参数。这在某些情况下可以加速初始化过程,但不是必须的,且可能会导致在不同batch大小上重复使用模型时出现...
March 18, 2024

使用PyCharm创建虚拟环境项目导入环境变量

在 PyCharm 中设置和导入环境变量可以通过以下步骤完成:打开 PyCharm 并选择你的项目。导航到 "Run" -> "Edit Configurations"。在 "Environment variables" 部分,你可以手动设置环境变量,或者使用 "+" 和 "−" 按钮来添加或删除变量。如果你想要导入现有的环境变量,可以点击 "Import" 按钮,然后选择 "Syst...
January 22, 2024

Python 打包 2023 年回顾

A year ago, I wrote about the sad state of Python packaging. The large number of tools in the space, the emphasis on writing vague standards instead of rallying around the One True Tool, and the co...
January 7, 2024

Python常用三方库

Python常用三方库,小编根据工作经验分了下类,仅供参考:后端框架类、办公类、数据分析类、爬虫类、GIS类、人工智能类等。一、后端框架类1、DjangoDjango 是Python中最为流行的Web框架之一,它提供了完整的Web开发支持,包括ORM、模板引擎、路由、中间件等功能。2、FlaskFlask 是Python中最为常用的Web框架之一,它提供了轻量级的Web开发支持,同时也支持R...
January 6, 2024

python 伪原创 近义词替换

简介对于搜索引擎SEO,很多运营人员都有快速输出文章并添加到网站;以期搜索引起快速收入并提高排名的要求。现实是哪怕是李白也只是在喝完一斗酒才能诗百篇。运营人员或者编辑人员需要的是在短时间内能够生成伪原创文章,根据已有文章生成伪原创。思路:首先通过Scan函数获取文件夹中的文件路径列表,然后通过Read函数读取文件内容,并提取出标题和文章内容。接着使用正则表达式提取出标题和文章内容,并去除不需...
January 2, 2024

轻松处理表格数据集的 Python 库tablib实现数据导出为json/csv/excel等常见格式

简介:tablib允许您导入、导出和操作表格数据集。高级功能包括隔离、动态列、标签和过滤以及无缝格式导入和导出。安装当然,推荐的安装 Tablib 的方法是使用pip:$ pip install tablib 您还可以选择安装更多依赖项以获得更多可用的导入/导出格式:$ pip install "tablib\[xlsx\]" 或所有可能的格式:$ pip install...
November 14, 2023

HarmonyOS开发:DevEco Studio通义灵码安装教程

步骤1已安装 DevEco Studio 的情况下:DevEco Studio 菜单下点击 Preferences -》Plugins下载离线包安装1、下载 DevEco Studio 的 zip 安装包;点击下载离线安装包2点击导航-插件,点击设置图标,下拉菜单中单击从本地安装插件, 选择下载的 zip 文件后安装。步骤3重启 DevEco Studio,重启成功后登录阿里云账号,即刻...
October 20, 2023

Python pandas 使用技巧

一、 pd.to_datetime 格式化日期报错:ValueError: time data "2023-10-14T18:44:36-07:00" doesn't match format "%Y-%m-%d %H:%M:%S", at position 0. You might want to try: - passing `format...
August 16, 2023

索引的力量:利用 Pandas 提高数据整理效率

介绍Pandas 是使用最广泛的 Python 数据操作库,它使我们能够有效地访问和操作数据。通过在 Pandas 中有效地理解和利用索引技术,我们可以显着提高数据整理任务的速度和效率。在本文中,我们将探索 Pandas 中的各种索引技术,并将了解如何利用它们来更快地进行数据整理。在 Pandas 中引入索引Pandas 库提供了两个主要对象:Series 和 DataFrame。Panda...
August 15, 2023

利用 FastAPI 中的后台任务:增强性能和响应能力

介绍FastAPI是一个用于用 Python 编写 API 的领先 Web 框架,拥有卓越的速度、用户友好的属性和出色的异步功能。其中,一个突出的功能是FastAPI的BackgroundTasks——一种创新工具,旨在管理长时间运行、耗时的任务,而不会抑制主要应用程序操作。在这篇博文中,我们将深入研究 FastAPI 的后台任务,阐明它们如何显着提高应用程序性能和响应能力。我们将通过一个简...