Python関連のことを調べてみた2022年08月18日

Python関連のことを調べてみた2022年08月18日
目次

Google Colaboratory で同じ単語を一括で選択するショートカットキー

Google Colaboratory ではカーソルのある単語と同じ単語がハイライト表示される。
`Ctrl + Shift + L` で、それらを一括選択し、編集できる。

元記事を表示

Codeforces Round #814 (Div. 2)のA, B, C問題をPythonで解く

## 初めに
こんにちは。この記事では先日(2022/08/16)行われたCodeforces Round #814 (Div. 2)のA, B, C問題の解説をPython3を用いてしていきます。Codeforcesは解説がAtCoderほど十分にないこと、そもそもPythonを使って解いている人も少ないことから、自身の解法とコードを共有しようと考えました。解説はコンテスト中に解けた問題+1問のみとしています。宜しくお願いします。

### コンテストへのリンク
[Codeforces](https://codeforces.com/) \
[Round #814 (Div. 2)](https://codeforces.com/contest/1719)

– [初めに](#初めに)
– [コンテストへのリンク](#コンテストへのリンク)
– [Problem A Chip game](#problem-a-chip-game)
– [問題文](#問題文)
– [入力](#入力)
– [出力](#出力)
– [解法](#解法)
– [ACコード](#acコー

元記事を表示

【Python】DjangoでOracleに接続する際にサービス名を指定したい

## 概要
DjangoでDBの設定をする際、[Django – settings.py – DATABASES](http://taustation.com/django-settings-py-databases/)の記事にあるように、`settings.py`にDBの接続情報を設定します。
今回はOracle Databaseに接続する際の設定内容についてメモ書きします。

## ハマったこと
Oracle Databaseのバージョンについて19cを使用したので、DjangoからはPDBにアクセスしたいです。PDBについて、[徹底解説!Oracle Database 12cのすべて Vol.2](https://www.ashisuto.co.jp/tech-note/article/20130912_oracle.html)の記事にある通り、DB作成時に合わせてPDBのサービスも作成されるので、このサービス名でアクセスしにいきたいと思います。
とりあえずは[こちら](https://docs.djangoproject.com/en/4.1/ref/databases/#id

元記事を表示

Ubuntu 22.04 pip3 で simstringをインストールする際は、quickumls-simstring を使う。

# 概要
Ubuntu22.04 で pip3 を用いて `simstring` を入れようとするとエラーになる。そのため、代わりに、`quickumls-simstring` を使う。
# simstringをpip3でインストールしようとしてうまく入らない。

[simstring](http://www.chokkan.org/software/simstring/index.html.ja) は高速かつシンプルな類似文字列検索ライブラリだ。pythonで類似文字列を検索する際に利用していた。ubuntu22.04にアップデートした際に、python3.8からpython3.10 へpythonか更新されていた。
simstringをpip3 で入れようとしてもうまく入らない。

いろいろ試行錯誤をしたが、うまくいかなかった。
# simstingは quickumls-simstring で入れる。

いろいろ調べて、 [quickumls-simstring](https://pypi.org/project/quickumls-simstring/) としてメンテしてくれて

元記事を表示

RNN/LSTMで気温予測【3. 多変数編】

# はじめに
前回は気温のみのデータから予測を行うモデルを構築した。

https://qiita.com/Lukas04/items/885f5371f82b7ad7a635

https://qiita.com/Lukas04/items/761dec9864f1459832f7

今回は他のデータも用いることで精度の向上を図る。

# コードの変更
Datasetの次元が変わることになる。`n_features`を特徴量の数としてところどころコードを変更する。
## Dataset/DataLoaderの作成
“`Python
from sklearn.preprocessing import MinMaxScaler

import torch
from torch.utils.data import DataLoader

# 使用する特徴量
features = [‘temperature’, ‘atmosphere1’, ‘dew point’, ‘humidity’]
n_features = len(features)

y = df[features].value

元記事を表示

freee プログラミングコンテスト2022(ABC264) A~D問題 ものすごく丁寧でわかりやすい解説 python 灰色~茶色コーダー向け #AtCoder

freee プログラミングコンテスト2022(AtCoder Beginner Contest 264) A~D問題の解説記事です。
灰色~茶色コーダーの方向けに解説しています。

その他のABC解説、動画などは以下です。

更新時はツイッターにて通知します。

https://qiita.com/sano192/items/54accd04df62242b70f0

# freee株式会社様について
本コンテストはfreee株式会社様が主催されています。
詳細はホームページを御覧ください。

https://www.freee.co.jp/

# A – “atcoder”.substr() Dif:8

https://atcoder.jp/contests/abc264/tasks/abc264_a

pythonでは文字列SのL~R番目を
S[L:R+1]
と書きます。Rではなく(R+1)となることに注意してください。
また、先頭の文字を0文字目、次を1文字目、…というように数えるため、問題文でいうL,R番目から一つ

元記事を表示

非線形最小二乗法を用いたIC50、Hill係数の推定(PythonとJuliaを用いて)

# はじめに

前回の記事で、R、Excel、GraphpadPrismの3つのソフトウェアを用いて非線形最小二乗法を行った。

https://qiita.com/Yomiyama1998/items/14343814d08b0a3a3f0b

今回はPythonとJuliaで非線形最小二乗法を行う。

今回も用いるデータは、ガルバッタ氏のこの記事で用いているデータである。

https://mikuhatsune.hatenadiary.com/entry/20120120/1327070834

一応記しておくが、

用量反応曲線(4パラメータモデル)は
$$
pred[i]=botom+ \frac{Top}{1+10^{hill(EC_{50}-Conc[i])}}
$$
と表され、
残差平方和(重み付けなし)は、

$$
RSS=(y[i]-pred[i])^2
$$
で求められる。

# 実行環境

Python

“`Python

>import sys

>print(sys.version)

3.9.12 (main, Apr 4 2022, 05:22

元記事を表示

python get first n elements of list

“`
numList[:3]
“`

元記事を表示

numpy select column

“`
closeArr = npArr[:, 3]
“`

元記事を表示

CLAMのメインの処理を整理してみた

## 概要
CLAMは2020年にハーバード大学医学部ブリガム・アンド・ウイメンズ病院 病理部のMing Y.Lu氏らが発表した、スライド画像から特徴量を抽出し、スライド単位のラベルを用いて弱教師あり学習でクラス分類を行うスクリプトです。

スライド画像とラベルを用いてモデルに学習させることで、パッチ単位でラベルの特徴が強い箇所を推測することができます。
スライド単位のラベルを持つ画像に対して、スライドに含まれる多くの情報を活かすことでより効率的に学習が行えるという考え方のようです。

**・イメージ図**
推論イメージ

基本的にはLinuxを前提としていますが、フォルダパスを一部編集することでWindowsでも使用できます。
概要と実際の使用した結果についてはこちらの記事をご参照いただけましたら幸いです。
➡ [CLAM(Clust

元記事を表示

非線形整数計画法を使って「要素数」最小化をやってみた

# この記事の内容
ソルバーしか使えない私が、栄養最適化問題で、食品の種類を最小にしたくて、非線形数理最適化をやってみた結果を紹介します。

# 要素数最小化の意義
例えば栄養最適化の場合、20種類もの食品の組み合わせになると買うのが面倒です。
個人の買い物くらいならまだいいですが、これが栄養最適化食品工場のだと考えると、原料の仕入れ、在庫の調整や生産に使うラインの数を食品ごとに用意することの運用コストの方が原料コストを上回る気がします。

# 最適化問題
通常の栄養最適化問題は、必要な栄養摂取量の範囲に収まる中で最安値となる食品の組み合わせを探す問題になります。
これは整数線形計画の問題として書けて、
制約条件:
Min(N) < sum( N(f) * x(f) ) < Max(N) 目的関数: sum( cost(f) * x(f) ) N(f): 栄養素 N について、食品 f に含まれる栄養素の量 x(f): 食品 f の個数 Min(N), Max(N): 栄養素 N の摂取量の上下限値 cost(f):食品 f の1個当たりの値段 食品の「種類数」を最小化しようと

元記事を表示

モテない俺がseq2seqでアマガミの七咲bot作ったけど秒でフラれた話

# 概要
夏休み、僕は自分に合った女性にアプローチするために、[男女のタイプ分けCNN(SSD)](https://qiita.com/kangaroo-san/items/3aa25282c53f3d3a4b15)を制作してきました。
その過程で、渋谷で実際のカップルに聞き取り調査を行っています。

そんな調査をしていると、やはり
「妬ましい。世のカップルが妬ましい!!」
と思ってしまうものです。

ということで、以下のUdemyの教材で学習した内容を参考に彼女っぽい会話をしてくれるbotの制作を行うことにしました。

https://www.udemy.com/course/ai-nlp-bot/

# データ作り
## データ収集
Seq2seqでの対話を可能とする学習データには、inputとoutputのテキストデータが必要となります。
僕には野望がありました。

それは、僕の大好きなギャルゲである「アマガミ」の七咲逢ちゃんを彼女にすることです。

さらにここに打算として七咲逢は作中トップの人気を誇り、その二次創作はごまんと溢れているという事実が追加されます。

つまり、世の中

元記事を表示

【厳選】エンジニアにおすすめのビジネス寄りTwitterアカウント30選

# はじめに
最近、私が開発した翻訳サービスである[meta翻訳](https://meta-school.web.app)でもサブスクサービスを始めました。
([有料記事](http://localhost:3000/articles)を現在月額980円で提供するというものです。)

私自身、日頃のインプットにはTwitterを一番活用しているのですが、フォローしている方はエンジニア系の人が大半で、技術的なインプットが大半となっています。

自分がサブスクを始めたのもあり、世間のニーズを捉える上で、ビジネス系の発信を常日頃から見ておくのは大事なことだとふと思いました。

そこで今回、ビジネスサイドの知見を広める必要を感じ、片っ端から良さそうなアカウントをフォローして情報収集基盤を整理することにしました。

選んだ基準としては以下を意識しました
– エンジニアとの親和性の高さ
– 様々な業界を網羅
– ITサービスを運営してる人

先日、「[【厳選】機械学習の学習におすすめのTwitterアカウント40選](https://qiita.com/goto_yuta_/item

元記事を表示

OpenCV学習メモ 画像認識でPDF図面から特定の部品を含むものを判定する

## やりたいこと
古い図面群(PDF)から過去の特注仕様を調べることが多いので、この目視作業をやめたい。減らしたい。

画像認識的なやつでこんなことができたらと思って始めてからの学習メモを育てていく。

– 特注仕様(姿図や記号、文字列)を図番ごとに分類
– 指定の特注仕様(姿図や記号、文字列)を持つ図面を発掘

## やること・やったこと

取り消し線引いてないやつは未完

1. ~~何のこっちゃからネットコピペで体験(GoogleColab)~~
1. ~~カスケード分類器を自作する(VSCode createsamples.exe)~~
1. PDFの読み込みと評価
1. ~~PDF→JPEGに変換~~
1. 変換後のJPEGを探索
1. 判定結果を返す
1. 複数ファイルを巡回
1. 複数条件で巡回

## 各項目
### 何のこっちゃからネットコピペで体験
この記事のとおりにやったらまあできた(顔認証のところまで)

GoogleColabの導入から懇切丁寧なのでマジで助かる

https://www.codexa.net/opencv_python_int

元記事を表示

ProphetとTwitterで人生を振り返る

# 全Tweetで振り返る
## Tweet数で時系列分析
自分の何かを反映している気がしたので、Tweet数の変化について時系列分析してみます

– 時系列データの可視化
– (全体/年次/月次/日次)トレンドの可視化
– 変化点検知ロジックによる変化点の検出

を、Prophetに投げつけて分析します。

参考文献: [こちらのブログ](https://data.gunosy.io/entry/change-point-detection-prophet)

## データの準備 – Twitterからのデータ取得
Twitter公式からツイートを取得しようとしたら時間がかかったので、
[Twilog](https://twilog.org/settings.rb)から取得してみます。
csvで取得するとツイート内の改行の扱いが手間だったので、xmlで取得してみました。

## ライブラリの準備 – XMLの処理用
xmlの処理に必要なライブラリをインポートします。

“`python
import pandas as pd
! pip install xmljson
impor

元記事を表示

Sweet Home 3d上の仮想空間を散歩するPGM

Sweet Home 3d上の仮想空間を散歩するPGM

sweet Home 3d上の仮想空間を実際の動作変化を検出することで足踏み等動いている間だけ
カメラ移動・散歩するPGMをpythonで作りました


仮想空間のサイト
Sweet Home 3D – Draw floor plans and arrange furniture freely


github: https://github.com/NanjoMiyako/WalkingInSpace


使い方

0.使用前に以下スクリーンショット中のA~Eの座標をPGM上から設定します
![screenshot1.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/412430/2e24140a-e063-9d6d-fd81-98029af7520d.png)

(github上のscreenshot1

元記事を表示

ゼロからはじめる機械学習講座「教師なし学習と自然言語処理入門」

## サンプルソースの公開場所
https://github.com/techgymjp/techgym_ai
実行環境がない場合はanacondaをinstallしてください

### 解説動画

# ■1-2:クラスタリング:G9xs.py
【問題】
分類データセット生成の関数を使ってデータを生成してクラスタリングをしてみよう。
(1) make_blobs関数でrandom_state=5として、生成したデータを散布図に書く。
■解答はY7AM.py

(2)クラスタリングをしてクラスタ番号でデータを色分けする。
■解答はF9MH.py

# ■1-5:主成分分析(PCA):Q3SR.py
 分析対象のデータには多くの変数があり、一つ一つの変数間の関係を調べていくには大変な場合がある。そこで、変数の種類を圧縮しつつ元のデータの性質を残して分析する手法として、主成分分析(Principle Component Analysis)がある。また、数値のもつ意味も変数によって異なることがあり、平均値や標準偏差が異なる場合には単純

元記事を表示

Windows 上にイケてる python(機械学習入門) 環境を構築する

いいからWindowsは窓から投げ捨てろ!!!

Windows上に機械学習関連の環境を構築するにはどうすればよいですか?と聞かれていたときのつい最近までの俺の本音ですw
がこれまた、環境が激変して、すげー簡単にイケてるpython環境が構築できるようになっていました。WSL2 スゲー

## WSL2 の導入
まずは以下のサイトを参考にWSL2を導入します。
https://softantenna.com/blog/how-to-setup-wsl2-wndows-11/
https://chigusa-web.com/blog/wsl2-win11/

ちなみにwindows 11だと大丈夫か?と不安になるくらい簡単です。
管理者権限で power shellを立ち上げて

“`winndows powershell
wsl –install
“`

と打つだけです。

あとは上記のブログの記事に従ってWSL2でいろいろいじってみてください。

この後は基本的にubuntuを使うのでpower shellが立ち上がった時に設定からubuntuが立ち上がるように変更するとよい感

元記事を表示

python-pptxでマスタースライドのプレイスホルダーを探す

ちょっと一定の様式のスライドを何枚も連続させる必要がありまして。
![スクリーンショット 2022-08-17 14.56.30.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/192970/45d7e903-bb01-4a03-48f0-5cda15134562.png)
まずスライドマスターとしてレイアウトを作成し、そのレイアウトのスライドに手入力…はめんどくさいので、CSVファイルとかにデータを入れておいて、それを流し込むことにします。VBAは分からないので、PythonでPowerPointのスライドを作れるライブラリ`python-pptx`を使います。

https://python-pptx.readthedocs.io/en/latest/

↓スライドマスターでレイアウトを作った図。今回はこれを`hinagataVisitorWP.pptx`として保存。
![スクリーンショット 2022-08-17 14.06.24.png](https://qiita-image-store.s3.a

元記事を表示

【AzureML】データの入出力を自作して自由度を上げてみる【Python】

今回はサンプルデータの`Multiclass Classification – Letter Recognition`を利用してみたいと思います。
また、入出力部分をpythonスクリプトにすることでデータストアとして設定していないコンテナのデータも取得できるようにしてみたいと思います。

ワークスペースやクラスターの作成、実行方法等は[最初の記事](https://qiita.com/K-Nomu3/items/6b9c89b958380ea67b64)を参考にしてください。

# サンプルを開く
今まで二項、回帰とやってきましたが今回は多項分類のパイプラインのようです。
![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/395106/e143f9a4-0a01-b0a3-3862-202a04d79266.png)
一番左のカラムを予測するみたいですね。
多項分類は複数項目のうちどれかを予測するようなモデルになります。
二項の項目が増えた感じですね。
![image.png](https

元記事を表示

OTHERカテゴリの最新記事