データ分析、ML、AI
見つかりました 11 個のスキル
このスキルは、Pythonでアノテーション付きデータ行列を処理する場合、特に単一細胞ゲノミクス解析、メタデータとともに実験測定値を管理する場合、または大規模な生物学的データセットを処理する場合に使用されます。AnnDataオブジェクト、h5adファイル、単一細胞RNA-seqデータ、またはscanpy/scverseツールとの統合を含むタスクの場合に使用してください。
並列/分散コンピューティング。メモリを超えたpandas/NumPyのスケーリング、並列DataFrames/Arrays、マルチファイル処理、タスクグラフにより、RAMより大きなデータセットと並列ワークフローに対応。
Pythonのインターフェースが簡略化され、適切なデフォルト設定がされたRDKitのラッパー。標準的な創薬用途(SMILES解析、標準化、記述子、指紋、クラスタリング、3Dコンフォーマー、並列処理)に推奨。rdkit.Chem.Molオブジェクトをネイティブで返却。高度な制御やカスタムパラメーターが必要な場合は、直接RDKitを使用してください。
質量分析データ解析のためのOpenMSへのPythonインターフェース。LC-MS/MSプロテオミクスおよびメタボロミクスのワークフロー、包括的なファイルハンドリング(mzML、mzXML、mzTab、FASTA、pepXML、protXML、mzIdentML)、信号処理、特徴検出、ペプチド識別、定量解析に使用します。質量分析データの処理、プロテオミクス実験の解析、またはメタボロミクスデータセットの処理を行う際に適用します。
ScholarEval手法に基づく学術研究業績を評価するための体系的なフレームワーク。このスキルは、研究論文の評価、文献レビューの評価、研究方法論のスコア付け、科学的な文章の質の分析、または学術業績に構造化された評価基準を適用する場合に使用する必要がある。問題の設定、文献レビュー、方法論、データ収集、分析、結果の解釈、学術的な文章の質を含む複数の次元にわたる総合的な評価を提供する。
科学的な原稿の作成。IMRAD構造、引用(APA/AMA/Vancouver)、図表、報告ガイドライン(CONSORT/STROBE/PRISMA)、抄録、研究論文および雑誌投稿向け。
scikit-learnを使用したPythonによる機械学習。教師あり学習(分類、回帰)、教師なし学習(クラスタリング、次元削減)、モデル評価、ハイパーパラメータチューニング、前処理、または機械学習パイプラインの構築を行う場合に使用します。アルゴリズム、前処理手法、パイプライン、およびベストプラクティスに関する包括的なリファレンスドキュメンテーションを提供します。
このスキルは、scvi-tools を使用した単一細胞オミクスデータ解析(scRNA-seq、scATAC-seq、CITE-seq、空間トランスクリプトミクス、その他の単一細胞モダリティを含む)を行う際に使用します。確率的モデリング、バッチ補正、次元削減、差次的発現、細胞型アノテーション、マルチモーダル統合、空間解析タスクにこのスキルを使用します。
グラフニューラルネットワーク(PyG)。ノード/グラフ分類、リンク予測、GCN、GAT、GraphSAGE、異種グラフ、分子特性予測、幾何学的深層学習向け。
UMAP次元削減。高次元データに対する、2D/3D可視化のための高速非線形多様体学習、クラスタリング前処理(HDBSCAN)、教師あり/パラメトリックUMAP。
このスキルは、使用可能なRAMを超える大きな表形式データセット(数十亿行)の処理と分析に使用します。Vaexは、コア外のDataFrame操作、遅延評価、高速集計、ビッグデータの効率的な可視化、および大きなデータセットでの機械学習に優れています。ユーザーが大きなCSV/HDF5/Arrow/Parquetファイルを使用して作業する必要がある場合、大規模なデータセットで高速な統計を実行する場合、ビッグデータの可視化を作成する場合、またはメモリに収まらないMLパイプラインを構築する場合に適用します。