LucaGroup
/

LucaOne-default-step5.6M

Biological Foundation Model

Unified Nucleic Acid and Protein Language Model

Model card Files Files and versions

LucaGroup commited on Aug 12

Commit

a3b7fef

·

verified ·

1 Parent(s): 72da594

Update README.md

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -2,9 +2,9 @@
 license: apache-2.0
 ---
-# LucaGPLM
-LucaGPLM - The LUCA general purpose language model.
 ## Installation
@@ -20,14 +20,17 @@ pip install lucagplm
 from lucagplm import LucaGPLMModel, LucaGPLMTokenizer
 # Load model
-model = LucaGPLMModel.from_pretrained("Yuanfei/LucaOne-default-step5.6M")
-tokenizer = LucaGPLMTokenizer.from_pretrained("Yuanfei/LucaOne-default-step5.6M")
 # Example usage
 seq = "ATCG"
 inputs = tokenizer(seq, seq_type="gene",return_tensors="pt")
 outputs = model(**inputs)
 seq = "NSQTA"
 inputs = tokenizer(seq, seq_type="prot",return_tensors="pt")
 outputs = model(**inputs)

 license: apache-2.0
 ---
+# LucaOne/LucaGPLM(old checkpoint)
+LucaOne/LucaGPLM - The LUCA Gene-Protein language model.
 ## Installation
 from lucagplm import LucaGPLMModel, LucaGPLMTokenizer
 # Load model
+model = LucaGPLMModel.from_pretrained("LucaGroup/LucaOne-default-step5.6M")
+tokenizer = LucaGPLMTokenizer.from_pretrained("LucaGroup/LucaOne-default-step5.6M")
 # Example usage
 seq = "ATCG"
+# seq_type="gene", which includes DNA or RNA(Nucleotide Sequences)
 inputs = tokenizer(seq, seq_type="gene",return_tensors="pt")
 outputs = model(**inputs)
+print(outputs.last_hidden_state.shape)
 seq = "NSQTA"
 inputs = tokenizer(seq, seq_type="prot",return_tensors="pt")
 outputs = model(**inputs)