高效码农

撰写、分享国内外先进的IT技术

分类 机器学习 下的文章

July 12, 2019

Kaggle、Python机器学习教程(四):验证模型

你已经建立了一个模型。 但它是否可用?在本课程中,您将学习如何使用模型验证来衡量模型的质量。 测量模型质量是迭代改进模型的关键。什么是模型验证您将要评估您构建的几乎所有模型。在大多数(尽管不是全部)应用中,模型质量的相关度量是预测准确性。换句话说,模型的预测是否接近实际发生的情况。在测量预测准确性时,许多人犯了一个大错误。他们使用他们的训练数据进行预测,并将这些预测与训练数据中的目标值进行比...
July 8, 2019

Kaggle、Python机器学习教程(三):建立第一个机器学习模型

选择建模数据您的数据集有太多的变量,以至于您无法理解,甚至无法很好地打印出来。如何将如此庞大的数据压缩到您能够理解的程度?我们先用直觉选择几个变量。稍后的课程将向您展示自动对变量进行优先排序的统计技术。要选择变量/列,我们需要看到数据集中所有列的列表。这是通过DataFrame的columns属性完成的。#!/usr/bin/python3 # -*- coding: utf-8 -*- ...
July 7, 2019

Kaggle、Python机器学习教程(二):数据探索

使用Pandas熟悉您的数据使用Pandas熟悉您的数据,机器学习项目的第一步都是熟悉数据。 你将使用Pandas库。 Pandas是科学家用于探索和操纵数据的主要工具。 大多数人在他们的代码中将pandas缩写为pd。 我们使用命令执行此操作import pandas as pdPandas库中最重要的部分是DataFrame。 DataFrame是一个二维的表结构。 这类似于Excel中...
May 11, 2019

机器学习准备工作:TensorFlow 基础知识

TensorFlow 中编码的"Hello World"hello_world.ipynb:官方练习地址以下代码块为"Hello World"TensorFlow 程序。其中包含初始化代码(导入 TensorFlow 模块并启用"eager execution",我们将在后续练习中详细介绍此操作),然后输出"Hello, world!"字符串常量。#!/usr/bin/python3.7.3...
May 10, 2019

机器学习准备工作:Pandas 使用入门

机器学习的前提条件和准备工作参考网址:前提条件和准备工作一、Pandas安装pandas可以通过PyPI的 pip安装pip install pandaspandas依赖包:setuptools:24.2.0或更高版本NumPy:1.12.0或更高python-dateutil:2.5.0或更高版本pytz注意 强烈建议您安装这些库,因为它们可以提高速度,尤其是在处理大型数据集时。二、简介p...