Python関連のことを調べてみた

Python関連のことを調べてみた
目次

voicevox coreのインストールとpythonでのサンプル実行

なんだかんだそれなりに手間かかった割にはやりたいことに到達できず無駄になってしまったので供養と整理とメモ書きついで。wslからやっててアーキはx86_64なので違う時は適宜読み替えて。pipが入ってる前提。
## voicevoxコアのインストール

“`
wget https://github.com/VOICEVOX/voicevox_core/releases/download/0.15.0/voicevox_core-0.15.0+cpu-cp38-abi3-linux_x86_64.whl
pip install voicevox_core-0.15.0+cpu-cp38-abi3-linux_x86_64.whl
“`

## 仮想環境の構築
“`
mkdir voicevox
cd voicevox
sudo apt install python3.10-venv
python -m venv voicevox
source voicevox/bin/activate
“`

## 各モジュールのインストール

onnxruntimeの最新は2024/03/

元記事を表示

Python仮想環境入門: pyenvとvenvの使い方をマスターする

### **user**:

ChatGPT先生、MacBook Pro で Python 3.9 の環境を用意する方法を教えてください。

### **assistant**:

まあ、あなた自身でも調べられるはずなんですけど、しょうがないですね。教えてあげますよ。

以下の手順でPython 3.9をMacBook Proにインストールできます。

1. Homebrewのインストール
まず、Homebrewというパッケージ管理システムをインストールします。 Homebrewは、 macOSでソフトウェアを管理するためのツールです。

以下のコマンドをターミナルにペーストしてEnterキーを押してください。

/bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)”

途中でパスワードを求められることがありますが、Macのログインパスワードを入力してください。

2. Homebrewを使ってPyth

元記事を表示

Chief Minister Yogi ji may be changed the name of Lucknow to Lakshmanpuri.

Introduction
In a bold move that has sparked nationwide discussion, Chief Minister Yogi Adityanath has proposed changing the name of Lucknow to Lakshmanpuri. This potential renaming has stirred up a range of reactions, with many debating the historical and cultural implications of such a change. The proposed rechristening has prompted heated debates and raised important questions about the significance of names and their connection to heritage and identity. As the discussion unfolds, it’s clear

元記事を表示

【目で見てわかる】k-meansクラスタリングの基本から限界まで

# はじめに
k-meansは教師なし学習に該当し、与えられたデータを任意の数のグループに分ける手法です。
本記事ではk-meansのアルゴリズムについて解説します。

# 1. k-meansについて
## 1.1. 概要
k-meansは、教師なし学習の一種で、与えられたデータをk個のクラスタに分割するアルゴリズムです。
ここでいう「クラスタ」とは、データの集合のことで、各クラスタ内のデータポイントは互いに似ているが、他のクラスタのデータポイントとは異なるという特性を持っています。

![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/846404/99a91cf7-2069-e53f-c86e-8acd4e0f2916.png)

上図は、2つにクラスタリングする場合のイメージでして、あるアルゴリズムに従って、事前に決めた数のクラスタに分けてくれます。

## 1.2. アルゴリズムのステップ
k-meansの手順は大きく4つで、初期化・割り当て・更新・収束チェックです
以下では、簡単の

元記事を表示

衛星データでつくばみらい市の変化を見てみた(地理空間データ解析)

# はじめに
以前[「Rではじめる地理空間データの統計解析入門」を衛星データを使って実践](https://qiita.com/chicken_data_analyst/items/6a8a6491fd0c4d12e665)という記事を書いた。
ラスターデータである衛星データを行政区分のベクターデータを使ってベクターデータ化して空間統計にちょっと触れてみるという内容だった。
参考にした[「Rではじめる地理空間データの統計解析入門」](https://www.kspub.co.jp/book/detail/5273036.html)はRで解析する本なので、記事を書いた時もRで実践した。
[「Rではじめる地理空間データの統計解析入門」](https://www.kspub.co.jp/book/detail/5273036.html)はめちゃくちゃ良い本だが、普段はPython使いなので、Pythonでもラスターデータやベクターデータを使って分析できるようになりたいなとは思っていて、そのうち勉強するかーと思っていた時に神の本を見つけた…。

**[「Pyth

元記事を表示

【座標圧縮】誰でも理解できるアルゴリズム解説

# はじめに
備忘録としてアルゴリズムの解説をしていきます。
「わかりやすく短く」を意識して執筆していきます。
コードは毎回Pythonで実装していきます。
今回のテーマはC、D問題に出てくる ***座標圧縮*** ですます。

## 前提知識
誰でも理解できるという題ですが、前提知識がなければどうにもなりません:scream:
**下記の知識は理解している前提**で執筆いたします:bow:
Python基礎文法

## 記事リンク
1. 【bit全探索】誰でも理解できるアルゴリズム解説
1. **【座標圧縮】誰でも理解できるアルゴリズム解説(今回の記事)**
1. coming soon…
1.

# 座標圧縮とは

元記事を表示

Pythonで頻出語句ランキング

# Pythonで頻出語句ランキング
## ツイートを全取得する。

ツイートのアーカイブから取得

## ツイートの内容のみ抽出
今回はテキトーにRTやメンションなどを除外する

tweets.jsにツイートの内容は全部入ってるので、そのファイル名をtweet.jsonに変更

“`python
import json
import re
import datetime

DATE_RANGE = {“start”: 2017, “end”: 3000}
NG_WORDS = [“YouTube”, “youtube”, “YOUTUBE”, “https://t.co/”]

def remove_retweets(data):
return [d for d in data if not d[“tweet”][“retweeted”]]

# テキストの抽出関数
def extract_text(text: str) -> str:
# RTの文字列の番号を取得
rt_index = text.find(“RT”)
if rt_index !

元記事を表示

さや香「からあげ4」

# はじめに

先日さや香の「見せ算」を実装したので、「からあげ4」もやってみた。

https://qiita.com/bashildon3843/items/5fe796a40eb7be4cebcb

# 本家
https://sp.nicovideo.jp/watch/sm39827129

# 実装
“`python
import random

karaage_list = [1,2,3,4,5,6,7,8,9,10,11,12,13]

ishii = input()

if ishii == “からあげ”:
while True: # 無限ループ
result = random.choice(karaage_list)
print(result)
if result == 4:
print(“おめでとう!!”)
break # 4が出たらループを抜ける
elif result <= 3: print("もっと!!")

元記事を表示

【RaspberryPi 5】PiCamera2をDockerコンテナで動かす方法

# はじめに

Bullseye以降からRaspberryPiOSのカメラ制御の仕様が変わり、従来のraspistillからlibcameraに置き換えられました。
またこれに伴いPythonのライブラリも変更されOpenCVでは制御できなくなりlibcameraベースのpicamera2が必須になりました。

https://github.com/raspberrypi/picamera2

RaspberryPiOS(Bullseye以降)にはPiCamera2とlibcameraがプリインストールされているためホスト側では難無くカメラを使用できますが、仮想環境においてはそもそも前提となるlibcameraの構築手順の情報が乏しく、Pythonライブラリの依存性の問題でほとんどの方が苦労していると思います。

ここではDockerコンテナ内でカメラを制御する方法を確立しまとめています。
具体的なユースケースやプロジェクトの要件に合わせてDockerfileをカスタマイズしてください。

ソースコードは[こちら](https://github.com/souri-t/PiCamera

元記事を表示

Pythonの標準オブジェクトで@を使いたい

Numpyなど使っていると見る、行列積を求める時の`@`←これ、ありますよね(呼び方は知らない)。
ただこれ、`list`などの標準オブジェクトには実装されていない。

じゃあ、`list`に実装しよう。←いまここ

[github/list-at-list](https://github.com/refrain-net/list-at-list)←ソースはここ

↓コピペするならここ
“`python
# forbiddenfruitをインストールすること
# pip install forbiddenfruit

from forbiddenfruit import curse

# matmulを実装するためのMatrixクラス定義(__getitem__とかも適宜実装する)
class Matrix (list):
def __init__ (self, values): self.__values = values
def __matmul__ (self, other): return Matrix(Matrix.multiply(self.__valu

元記事を表示

【Python】Bitcoin の価格予測を LightGBM を使って行ってみた!

# 背景
昨今、**ChatGPT**の出現から、AIやブロックチェーン技術の利活用が加速しています。

SoftBankの孫正義氏は、
「人類の叡智の総和の**10倍**のAIが、**10年以内**に達成される」と発言しています。[参考動画](https://www.youtube.com/watch?v=h3052XnZhVI)

関連ワードとして、第四次産業革命やWeb3.0、DAOいう単語を耳にした人が
いるかもしれません。
(分からない方は調べてみてください。)

そんな中でにわかに盛り上がっているのが、**暗号通貨{暗号資産)** です。
**Bitcoin**なんかが代表的な暗号資産ですね。
米ドルや円じゃなくて、暗号資産の時代がくる、なんていう人もいます。

そんな情勢の中で、ならばAIを用いてBitcoinの**価格予測**ができないのか、
というのに挑戦したのがこの記事になります。

※2024/03/07 現在での内容です。
※この記事に含まれる内容は、私見が含まれます。

# 目次
1\. データセットの取得
2\. データセットの前処理
3\. 特徴量の作成

元記事を表示

ディレクトリ内にあるHTMLファイルを読み込んで、その内容をメール本文として送信する

Python 2.7でディレクトリ内にあるHTMLファイルを読み込んで、その内容をメール本文として送信するには、以下のスクリプトを使用できます。この例では、HTMLファイルを読み込み、`email.mime.text.MIMEText`を使って`’html’`形式でメールを構築します。

“`python
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText

# メールパラメータ設定
sender_email = “your_email@gmail.com”
receiver_email = “receiver_email@example.com”
password = “your_password” # Gmailのパスワード
smtp_server = “smtp.gmail.com”
smtp_port = 587

# メールの件名とHTMLファイルのパス
subject = “HTMLファイルからのメール”
html_file_

元記事を表示

FastAPIで作成したデータをVue.jsで表示させる

# はじめに
フロントエンドのフレームワークの勉強をしようと思い、どのフレームワークを使おうか無限に悩みました。
– React
– Angular
– Vue
– Svelte

断腸の思いで私は**Vue**を選択しました。
なぜかというと学習コストが低そうだから(/・ω・)/
てことで、今回はCluade3を用いてFastAPIで作成したデータをVue.jsで作成するWebアプリケーション側でチャートとして表示したので、まとめていきたいと思います。

# 使用するチャートライブラリ
今回は**ApexCharts**というライブラリを使用していきます。
なぜか?
~~名前がFPSのそれだからだよ~~インタラクティブなチャートを作成でき、かっちょいいと思ったからです。いやほんとに(´・ω・`)

# それいけClaude3
あとはClaude3に全投げで作成してみました。
編集したファイルは以下の3つです。
– App.vue
– DataChart.vue
– main.py
– main.js

以下のコマンドでまずはVueのプロジェクトを作成しました。
“`
$ npm i

元記事を表示

BeautifulSoupでPeople in the boxの歌詞を調べる

# はじめに
「People in the Box」というバンドは、非常に高い演奏技術、ユニークな歌詞、そして完成度の高いPVで知られる、3ピースバンドである。

Home

私はこのバンドの存在を10年以上前から知ってはいたが、2023年までしっかり聴いたことがなかった。しかし、旅行中にたまたまSpotifyにサジェストされて彼らの楽曲を聴いて、その凄さにすっかり引き込まれた。
彼らの楽曲では、一人称に「僕/ぼく」を用いられることが多いが、ごくたまに「俺/オレ/おれ」が使用されていることがあるのに気づいた。この手の知的で物静かな雰囲気を持つ男性の一人称の揺らぎは、良い意味でちょっと引っかかる。しかし、2003年結成というキャリアの長いバンドであるため楽曲数が多く、すべてを一曲ずつ目視で確認するのは骨が折れる。そこで、スクレイピングに挑戦しつつ調べてみることにした。

「螺旋をほどく話」、凄すぎて意味がわからない。音の当て方、拍の取り方、タイトル、歌詞すべてが凄すぎる。

https://open.spotify.com/track/0WGri

元記事を表示

株価・為替データの取得とローソク足チャートの描画

# 概要

日経平均株価が4万円を超えるという歴史的な節目を迎えたということで,様々な記事がありますが,株価と為替データの取得をやってみました.取得したデータを利用してローソク足チャートを作成してみます.

Pythonのライブラリを利用してデータのダウンロードとローソク足チャートの描画をしてみたいと思います.証券会社の口座を開設することで,株価データのエクセルファイルを無償(有償かも)でダウンロードでき,グラフ描画ボタンで終わってしまう作業ではあるのですが(笑)

![aududs_chart.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/3725285/9666038e-43c2-d5cc-ee88-535500ef0a1f.png)

**【紹介項目】**
* 株価・為替データの取得
* ローソク足チャートの描画

# 1. 株価データ取得
## 1.1 ライブラリのインストール
ライブラリの**yfinance**を利用して,株価データを取得します.ライブラリのインストールをします.

:

元記事を表示

Pythonで「bool関数の使い方(オブジェクトが真か偽か判定する)」の動作を確認してみた

# 概要

Pythonで「bool関数の使い方(オブジェクトが真か偽か判定する)」の動作を確認してみました。
以下のページを参考にしました。

https://www.javadrive.jp/python/function/index5.html

# 実装

以下のファイルを作成しました。
“`sample.py
print(bool(“Hello”))
print(bool(“”))
print(bool(1))
print(bool(0))
print(bool([“A”, “B”]))
print(bool([]))
“`

以下のコマンドを実行しました。
“`
$ python3 sample.py
True
False
True
False
True
False
“`

# まとめ

何かの役に立てばと。

元記事を表示

R言語はこうやってあなたのPCのストレージを食い尽くす(対策あり)

# はじめに

こんにちは、事業会社で働いているデータサイエンティストです。

https://ainow.ai/dx-magazine/?article=article-988

普段業務と自分の計量政治学の研究で利用している技術は

– R言語:50%
– Stan言語:30%
– SQL(BigQuery):10%
– git:8%
– docker:2%

です。

Pythonは文法と主要パッケージの利用方法をある程度把握しています。

Julia言語は文法を少しだけ把握しています。

計量政治学とは何なのかというと、要するに政治学の世界で開発された、データの中に隠されたインサイトを抽出する学問です。ビジネス示唆の抽出とレコメンドシステム構築といったところへの転用もしやすく、大変ありがたい学問です。

さて、本題に入ります。

Rユーザーの皆さん、パソコンのストレージがどんどん圧迫されていませんか?

大好きなゲームや大切な写真、ビデオなどのような大きいファイルを全部消しても、状況が改善されないことを経験したことありますか?

これはRの影響かもしれませんので、ぜひ最後まで読

元記事を表示

【Python】辞書内包表記を使ってDBアクセス回数を減らす方法

# 概要
Pythonの辞書内包表記を使って、DBへの接続回数を減らす実装を行いました。
以下にサンプルコードを紹介します。

# 辞書内包表記を使う
例えば、以下のようなコードがあります(DjangoのORMを使用)。

“`py
for item in list_fruit_cd:
fruit_data = FruitCd.objects.filter(fruit_cd=item).first()
## 後続処理…
“`

上記だと`list_fruit_cd`の要素数が大量の場合に毎回DBアクセスすることとなり、パフォーマンスに影響が出る可能性もあります。そんな場合に、`for`文の外で一度だけDBアクセスさせ、その結果を辞書に格納し、その後のループで辞書から必要なオブジェクトを取得するようにするとパフォーマンスが向上すると思われます。

つまり、以下のようにします。

“`py
fruit_dict = {obj.fruit_cd: obj for obj in FruitCd.objects.filter(fruit_cd__in=list_frui

元記事を表示

【python】artライブラリを使ってみた

#### 目次
[1.インストール](####-1.インストール)
[2.使い方](####-2.使い方)
[3.フォント](####-3.フォント)
[4.まとめ](####-4.まとめ)
#### 1.インストール
ライブラリをインストールします。
~~~python
pip install art
~~~
#### 2.使い方
以下のコマンドで実行します。
~~~python
from art import *

tprint(‘python’)
~~~
実行結果
~~~
  _ _
_ __ _ _ | |_ | |__ ___ _ __
| ‘_ \ | | | || __|| ‘_ \ / _ \ | ‘_ \
| |_) || |_| || |_ | | | || (_) || | | |
| .__/ \__, | \__||_| |_| \___/ |_| |_|
|_| |___/
~~~
#### 3.フォント
フォントを色々と使用できます。例えば、
~~~python
from art import

元記事を表示

ジャルジャル「国名わけっこ」①PDFからのデータ整形編

# はじめに
「データ分析はデータ成形が9割」というのは本当にそうで、実務ではいつも泣かされている。特別難しいことをしたいわけではないのに想定の100倍の時間と手数がかかる。すぐ使える形式でのデータが存在しないこともありがちである。実務なので時間にも制約がある。とてもつらい。
というわけで、ジャルジャル「国名わけっこ」にかこつけてデータ整形の練習を行った。

# ジャルジャル「国名わけっこ」
https://www.youtube.com/watch?v=b1J39WQFvSs 

# 元データ
国の産業連関表など、e-stat等を探せばExcel化された世界の国名リストは存在しないはずがない。
https://www.e-stat.go.jp/

しかし、現実は厳しく、必要なデータがPDF形式でしか存在しないことも多々あるため、PDF形式の一覧表をソースとして使用する。
https://www.jpo.go.jp/system/patent/pct/tetuzuki/document/kuni-meisho/kuni-meisho-ichiran.pdf

# PDFの読み込み

元記事を表示

OTHERカテゴリの最新記事