GitHub – Chen-micslab/Deep4D

pencarian tersimpan

Use saved searches to filter your results more quickly

Batalkan Buat pencarian tersimpan Setel ulang fokus pendaftaran

Anda masuk di tab atau jendela lain. Silakan muat ulang untuk menyegarkan sesi Anda. Anda keluar di tab atau jendela lain. Silakan muat ulang untuk menyegarkan sesi Anda. Anda berpindah akun di tab atau jendela lain. Silakan muat ulang untuk menyegarkan sesi Anda.

License

Notifikasi Anda harus masuk untuk mengubah pengaturan notifikasi Anda.

Chen-micslab/Deep4D

Komit ini bukan milik cabang mana pun dari repositori ini dan mungkin milik cabang di luar repositori.

utama Buka berkas kode

Folders and files

nama nama

pesan komit terakhir Tanggal komit terakhir

Latest commit

History

Tampilkan semua file

Repository files navigation

Deep4D

Introduction

Deep4D adalah model pembelajaran mendalam yang memprediksi mobilitas ion, waktu retensi, intensitas fragmen, dan status pengisian peptida untuk dihasilkan di perpustakaan 4D silico untuk proteomik dan fosfoproteomik DIA 4D. Jika diperlukan, Deep4D juga dapat memberikan kemampuan prediksi terpisah untuk mobilitas ion, waktu retensi, kekuatan fragmen, dan status pengisian daya. Jika Anda memiliki pertanyaan, silakan hubungi moran_chen123@foxmail. com.

Publications

M. Chen, P. Zhu, Q. Wan, X. Ruan, P. Wu, Y. Hao, Z. Zhang, J. Sun, W. Nie, S. Chen*. Cakupan Proteomik dan Fosfoproteomik Akuisisi Data Empat Dimensi.

Guide to generate a 4D library

1. Prepare peptide list

Daftar peptida disimpan dalam file nilai yang dipisahkan koma (CSV) yang berisi dua kolom: ‘Peptida’ dan ‘Muatan’. File CSV ini harus disimpan di direktori ‘Deep4D/dataset/data/peptida_list. csv’.

Peptida, Mengisi AAAAAAAAAGAFAGR, 2 aAAAAAAAAVAPSAAGR, 2 AAAAAATAPPSPGPAQPGPR, 2 AAAAAALeSQQSLQER, 2 AAAAAWEEPSSNGTAR, 2 AAAAFVLsANENNIALFK, 2 

PTM meliputi fosforilasi serin, treonin, dan tirosin, oksidasi metionin, dan asetilasi ujung-N protein. Ini direpresentasikan sebagai: S(phos)-s, T(phos)-t, Y(phos)-y, M(oksida)–e, asetat–a.

2. Generate 4D library

Pustaka 4D dibuat menggunakan skrip Deep4D/predict_4d_library. py. Parameter model ccs, model rt, dan model msms diperlukan dan disimpan sebagai file pth di direktori Deep4D/checkpoint. Jalankan Deep4D/predict_4d_library. py. contoh

Python predict_4d_library. p y-filename 'peptide_list. csv' --load_msms_param_dir './checkpoint/ms_model. pth' '. '-Library' Peaks '-slice 3-Batch_Size 50 

Description of argparse:

–Filename: peptin ‘csv’ file-load_msms_param_dir ildilectory–maxcharge: Biaya maksimum Daftar peptida: spektrum msms netral los tipe dari. Saat ini, ada dua jenis Deep4D, “Deepdia” dan “Deepphospho”. Deepdia ‘: Deepdia’: NH3 dan H20, ‘DEepphospho’: H3PO4. –Pelana: Tipe Perpustakaan 4D. Saat ini, Deep4D hanya berisi Puncak, yang mendukung perangkat lunak Peaks Online. -Slice: Jika skala daftar peptida tidak dapat dihitung karena terlalu besar, Anda dapat mengiris daftar. -Batch_size: ukuran batch.

4D Library formats

  1. Normal “: Normal ‘: Termasuk semua informasi yang diperlukan untuk pustaka spektrum normal. Kolom:
  • Peptida: Modifikasi peptida
  • Biaya: Keadaan Biaya Peptida
  • m_z: peptida m/z
  • RT: Waktu Penahanan
  • IM: mobilitas aeon
  • Fi. charge: Status pengisian fragmen
  • Fi. frgtype: fragmen b atau y tipe
  • Fi. frgnum: nomor seri fragmen
  • Fi. lostype: Jenis fragmen kehilangan netral
  • Fi. intensity: kekuatan perjuangan
  • Fi. m_z: fragmen m/z

Guide to train the model

a. Train ccs model

1. Prepare the training data

Data pelatihan disimpan dalam file Comma Dneamation (CSV) yang berisi tiga kolom, ‘peptida’, ‘biaya’, dan ‘CCS’. File CSV ini disimpan dalam direktori ‘CCS/Dataset/Data/CCS_DATA. CSV’.

Peptida, CCS Aaadiask, 1. 218. 8175142 AAQGEPQVQFK, 1. 264. 0467586 GHFNIQPNKK, 3. 4333. 97444 IAILGFKK, 2. 382. 816264 KIGEEEEEEE 44 

2. Encoding peptide

python encoding_ccs. py --filename 'ccs_data' --label 1 

-Label = 0 Jika ada label label CCS ada, label = 1. Label CCS tidak ada.

3. Train ccs model

Dalam kasus status pengisian daya tunggal, jalankan ‘CCS/train_ccs. py’, dan dalam beberapa status pengisian daya, eksekusi ‘CCS/train_ccs_z. py’.

Python train_ccs_z. py --filename 'ccs_data' -load_ccs_param_dir './checkpoint/ccs. pth' --lr 0. 00001 --terch_size 50 

-Menam: nama data pelatihan. —lowad_ccs_param_dir: Direktori file model CCS yang dipelajari. –LR: Tingkat belajar. Akhirnya, temukan file parameter di ‘/checkpoint/_ccs/’.

4. Predict ccs

Dalam kasus satu pengisian daya, jalankan ‘CCS/predict_ccs. py’, dan dalam kasus beberapa biaya, jalankan ‘CCS/predict_ccs_z. py’.

Python train_ccs_z. py ---filename 'ccs_test_data' -load_ccs_param_dir './checkpoint/ccs. pth' --atch_size 50 --label 1 

-Filename: Tes nama data. Dikodekan pada langkah 2. -Label = 1 Saat label CCS ada. Jika tidak ada label CCS, label = 0.

b. Train rt model

1. Prepare the training data

Data pelatihan disimpan dalam file yang dipisahka n-koma (CSV) yang berisi dua kolom, ‘peptida’ dan ‘rt’. File CSV ini disimpan dalam direktori ‘RT/Dataset/Data/rt_data. csv’.

Peptide, Rt Aaadiask, 6. 14166667 AAAQGEPQVQFK, 34. 835 GHFNIQPNKK, 12. 24 IAILGFAFKK, 51. 305 Kigeeeeqpeek, 16. 84666667 LQAeKR, 12. 26, 16. 84666667 LQAeKR, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 26, 12. 2. 

2. Encoding peptide

python encoding_rt. py --filename 'rt_data' --label 1 

-Label = 1 Jika ada label label RT. Jika tidak ada label RT, label = 0.

3. Train rt model

python train_rt. py ---Filename 'rt_data' -load_rt_param_dir './checkpoint/rt. pth' --lr 0. 00001 --batch_size 50 

-Menam: nama data pelatihan. -rowad_rt_param_dir: Direktori File Model Pembelajaran RT. –LR: Tingkat belajar. Akhirnya, tempatkan file parameter di ‘./checkpoint/_rt/’.

4. Predict rt

Python predict_rt. py ---Filename 'rt_test_data' -load_rt_param_dir './checkpoint/rt. pth' --atch_size 50 --label 1 

-Filename: Tes nama data. Ini dikodekan pada langkah 2. -Jika ada label label RT, label = 1. Label = 0 Jika tidak ada label RT.

c. Train msms model

1. Prepare the training data

Data pelatihan disimpan dalam file Nilai Ramalan Koma (CSV) yang berisi tujuh kolom: “peptida”, “biaya”, “fi. frgtype”, “fi. frgnum”, “fi. lostype”, “fi. intensity”. File CSV ini disimpan di direktori ‘MSMS/Data/Data/ms_data. csv’.

Peptida, muatan, fi. charge, fi. frgtype, fi. lostype, fi. intensity aaagsavsgagtpvagptgr, 2, 1, 4, noloss, 0, 1500 gtpvagptgr, 2, 1, b, 5, noloss, 0, 1417 aaagsAavsgagtgtgtgt , 4, noloss, 0. 2713 AAAGSAAVSGAGTPVAGPTGR, 2, 1, B, 6, NOLOSS, 0. 3218 AAAGSAAVSGAGTPVAGPTGR, 2, 1, Y, NOLOSS, 1. 0000 PVAGPTGR, 2, 1, B, 7, 7, NOLOSS, 0. 4. 474474474, , 1, y, 6, noloss, 0, 8539 

2. Encoding peptide

Python encoding_ms. py ---Filename 'msms_data' --label 1 --type 'deepdia' --maxcharge 3 

-Label = 1 Jika ada label label MSMS. Jika tidak ada label MSMS, label = 0: Jenis kerugian netral dari spektrum MSMS. Saat ini, ada dua jenis Deep4D: ‘Deepdia’ dan ‘Deepphospho’. Deepdia ‘: Deepdia’: NH3 dan H20, ‘DEepphospho’: H3PO4. -Maxcharge: Biaya dan muatan maksimum dari daftar peptida adalah [2, biaya maksimum], dan kisaran yang disarankan adalah [2, 4].

3. Train msms model

Python train_msms. p y-filename 'msms_data' -load_msms_daram_dir '. 

–FileName: Nama Data Pelatihan. —lowad_msms_param_dir: Direktori file model MSMS yang dipelajari. –LR: Tingkat belajar. -Type: Jenis LOS netral dari spektrum MSMS. Ada dua jenis Deep4D, “Deepdia” dan “Deepphospho”. Deepdia ‘: Deepdia’: NH3 dan H20, ‘DEepphospho’: H3PO4. Akhirnya, temukan file parameter di ‘./checkpoint/_/’.

4. Predict msms

Python predict_msms. py ---Filename 'msms_data' -load_msms_param_dir './checkpoint/ms. pth' --atch_size 5 0-Typdia 1. 

–Filename: Tes nama data. Ini juga dikodekan pada langkah 2. -Label: label = 1 jika ada label MSMS. Label = 0 Jika Label MSMS tidak ada.

d. Train charge state model

1. Prepare the training data

Data pelatihan disimpan dalam file Comma Divin Value (CSV) yang berisi tujuh kolom: peptida ‘,’ biaya ‘. File CSV ini disimpan di direktori ‘Charge_State/DataSet/Data/CAILG_DATA. CSV’.

Peptida, tuduhan aaaaaaaaaaaaaaaaaaaaaavapsaagr, 5 aaaaaatappspgpaqpgpr, 7 aaaalesqqslqer, 9 aaaaaweepsssssssssgtar, 3 auaflsanennial, 4 

Di sini, muatan masin g-masing peptida adalah jumlah dari semua status muatan. Contoh: Biaya peptida yang memiliki status muatan 2 dan 3 adalah 5.

2. Encoding peptide

Python encoding_charge. py ---Filename 'charge_data' --label 1 

-Label = 1 jika ada label label MSMS ada. Label = 0 Jika Label MSMS tidak ada.

3. Train charge model

Python train_charge. py ---filename 'charge_data' -load_param_dir './checkpoint/charge. pth' --lr 0. 00001 --terch_size 50 

-Menam: nama data pelatihan. -Load_param_dir: Direktori file dari model biaya yang dipelajari terlebih dahulu. –LR: Tingkat belajar. Akhirnya, temukan file parameter di ‘/checkpoint/_charge/’.

4. Predict charge

Python predict_charge. p y-filename 'charge_test_data' -load_param_dir './checkpoint/charge. pth' --atch_size 50 

–Filename: Tes nama data. Ini juga dikodekan pada langkah 2.

License

Deep4D didistribusikan di bawah lisensi Apache. Lihat file lisensi untuk detailnya.

Contacts

Jika Anda memiliki masalah, laporkan langsung ke pelacak penerbitan GitHub. Anda juga dapat mengirim umpan balik ke moran_chen123@qq. com.