# 同じ階層に配置してあるファイルの中身を表示する。
with open('sample.py') as _r:
print(_r.read())
# 結果を格納する変数を用意
res = []
# ファイルの読み込み
with open('sample.csv') as _r:
for row in _r:
# 改行を取り除き、カンマで区切って配列にする
rows = row.replace('\n','').split(',')
# 結果用の変数に追加
res.append(rows)
print(res)
for row in res:
# タブ区切りで表示
print('\t'.join(row))
import requests
# webサイトへアクセスしてデータを取得
html = requests.get('http://yahoo.co.jp')
# 取得したデータの最初の800文字を表示
print(html.content.decode('utf-8')[0:800])
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
# データフレームの作成
df = pd.DataFrame([[3,4],[4,5],[6,9],[2,8]],columns=['a','b'])
# データフレームを描画
df.plot()
df = pd.DataFrame([[3,4],[4,5],[6,9],[2,8]],columns=['1','2'])
# 散布図を描画
plt.scatter(df['1'],df['2'])
import pandas as pd
# 必要なライブラリのインポート
from sklearn import datasets, model_selection, svm, metrics
# 有名なアヤメのデータの読み込み
iris = datasets.load_iris()
# アヤメのデータをデータフレームに変換する。
iris_data = pd.DataFrame(data=iris.data, columns=iris.feature_names)
# 5行だけ表示
iris_data.head()
# ラベルデータの読み込み
iris_label = pd.Series(data=iris.target)
# 5行だけ表示
iris_label.head()
# アヤメのデータを訓練データ、テストデータ、訓練ラベル、テストラベルに分ける。
train_data, test_data, train_label, test_label = model_selection.train_test_split(iris_data, iris_label)
# 訓練データ
train_data.head()
# 訓練ラベル
train_label.head()
# 訓練データとテストデータの個数
print(len(train_data), '\t', len(test_data))
# SVM学習器の定義
clf = svm.SVC()
# 訓練データで学習
clf.fit(train_data, train_label)
# テストデータで予測
pre = clf.predict(test_data)
print(type(pre))
print(pre)
# 正答率
ac_score = metrics.accuracy_score(test_label, pre)
print(ac_score)