Protein

UniProt accession
C1KFN1 [UniProt]
Protein name
Putative tail lysin
PhaLP type
endolysin

evidence: GO annotation

probability: 99 % (predicted by ML model)

Protein sequence
MGKEDIMADQARFGRLRLPVITLYIHTEHSVFKVSNAGQNNATQANADQNAFNSDIISFKTTNNMSDDSATFSVVLPLRRNNGVRWDNVISENDIIVIRIDSNEDLLNKGVTATVNNNIMTGIVSEVAIDGEYSSNSEMVQVTGQSFSKVFSQFRIGMISEVEQQLSGMGWLWDSSISPDAYTGSGDSDDSGGSGASVGDFDAGSGSTSEQLKALCKQIGSKTGIKWEFILAQVGVEVGSLDGNSYAAKNDNNFSGIKYANQEGATSGSNATDGAGGAYAHFKSKAYWALAMSNTLAKDDKSTGNALSSAKTVYDFAKGLKAAHYFEADVGQYAAGLDTWYKKITGQSSSTSGSTSGSSSTSSGSSDGGDGTTTDAAIAAEKAASPNGGVAFYDNNVAGIESALIERFKPYIILNYDNNGYTIWSFLDYSNMTSWDTYEKLKDSSNFVNFSGTLYELMQAAQRQPFNEMFFDSTSDGISKLTVRRTPFNPEDWYNLQQVTIGNDAIITKQVSRSAREQYSVFVDNPASGLLSIGVDSLAFGSFPKTNLDLIKVYGYAKMEVSDLYVTGADDKDYSINGGDIKKAKSTNNEKGTMYDYEKVVEFLSTTTSKTNLTQKPLTYSQELANKSNNISMFQASRLVNAYISNAYNLTEVVYNDIMNTDQGGGQANTGTHKLSYTEVSKFIKSSSNLSDFLTKSKPYFKNVSDEELTAIYNASESGKIDKKAYDTAVKNYDKTDSGEKSTSSLLDTDFFQTTLYNWYANNVNFLSGTITILGDPDIRIGTILNDAYDHIRYYIESVSHTFSFTEGFQTEIGVTRGLTYQDGQYDPRFTATYMWGTGIDYQGGYMGEAPVNYLAIDGSGGDGNDSSDGSGAFSGDAGPATAVKAAKYGATFEKSKCKRSEWYVWGGGHGGGNILESSEDPIKLDCSGFISACFNHVGLNINGTTWTFNDSSLFTHVPIPSTSTDGMKIGDCVLLYGCNHIMFYVGGGKLMGWNGNPPTDTSGGCKIVTLSDMQGHHDGYVLRLKG
Physico‐chemical
properties
protein length:1027 AA
molecular weight:111069,00000 Da
isoelectric point:4,78945
aromaticity:0,10808
hydropathy:-0,40857

Domains

Domains [InterPro]
Protein sequence: C1KFN1
1 1027
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Mooreparkvirus Lb3381
[NCBI]
632112 Herelleviridae > Mooreparkvirus >
Host Lactobacillus paracasei
[NCBI]
1597 Bacteria > Firmicutes > Bacilli > Lactobacillales > Lactobacillaceae > Lactobacillus

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ACO37042.1 [NCBI]
Genbank nucleotide accession
FJ822135 [NCBI]
CDS location
range 76501 -> 79584
strand +
CDS
ATGGGTAAGGAAGATATTATGGCAGATCAAGCAAGATTTGGTAGGCTAAGGCTACCAGTTATTACACTATACATACATACGGAACACTCTGTTTTTAAGGTGTCGAATGCTGGGCAGAATAACGCGACACAGGCTAATGCAGATCAAAACGCTTTTAACTCTGACATTATCTCTTTTAAAACAACAAATAACATGTCTGATGATTCTGCAACCTTTTCCGTTGTCCTTCCTTTAAGAAGAAACAACGGTGTTCGATGGGACAACGTTATTAGCGAGAATGACATTATTGTAATCAGGATTGATAGCAATGAAGATTTGTTAAATAAAGGTGTAACAGCTACTGTTAACAACAACATTATGACCGGAATTGTATCCGAAGTAGCTATTGATGGTGAATATTCTTCAAATTCAGAAATGGTGCAAGTAACCGGGCAAAGCTTTTCTAAGGTGTTTTCTCAGTTTCGTATTGGTATGATTTCAGAAGTTGAGCAACAATTATCCGGGATGGGATGGCTATGGGATAGTTCCATTTCTCCAGATGCATATACCGGTAGTGGCGACTCTGACGATTCTGGCGGTTCTGGAGCAAGTGTAGGGGACTTTGATGCAGGGTCTGGATCAACATCTGAACAATTAAAGGCATTGTGCAAGCAGATAGGTAGTAAGACTGGCATTAAATGGGAGTTTATTCTTGCTCAAGTTGGTGTTGAAGTAGGTAGTCTTGACGGGAACTCCTATGCTGCTAAAAATGATAATAACTTTTCTGGGATAAAGTATGCTAATCAAGAAGGGGCAACATCAGGGTCTAATGCAACTGATGGTGCAGGTGGTGCTTATGCACATTTTAAGAGTAAGGCATACTGGGCACTAGCTATGAGTAACACTTTAGCTAAGGATGACAAGAGTACAGGCAATGCTTTATCCAGTGCTAAAACTGTTTATGATTTTGCTAAAGGGCTTAAAGCAGCCCATTATTTTGAAGCAGATGTAGGCCAATATGCAGCTGGCCTTGACACTTGGTACAAGAAGATAACAGGGCAGAGTAGCTCTACCTCAGGGTCAACGTCTGGAAGTTCGAGTACATCATCTGGGTCAAGTGATGGTGGTGATGGCACTACAACAGATGCTGCTATTGCAGCTGAAAAAGCTGCTAGTCCAAATGGCGGCGTTGCTTTTTATGACAACAATGTGGCTGGTATTGAGAGTGCTCTTATTGAGCGATTTAAGCCATATATTATTTTAAACTACGATAATAATGGCTACACTATATGGAGTTTTCTTGACTATAGTAACATGACTTCTTGGGATACGTATGAGAAGCTAAAAGACAGTTCAAATTTCGTTAACTTTTCTGGTACTTTGTATGAGTTGATGCAAGCAGCGCAACGACAGCCATTTAACGAGATGTTCTTTGATTCAACCTCAGATGGCATTTCAAAGCTTACAGTAAGGCGCACACCATTTAACCCAGAGGATTGGTATAACTTACAGCAAGTAACAATAGGTAACGATGCTATTATTACTAAGCAAGTTAGTCGATCTGCTAGAGAGCAATATTCTGTTTTCGTTGATAATCCTGCTAGTGGGCTATTATCTATAGGTGTTGACTCATTAGCATTTGGTAGCTTTCCAAAGACAAACTTAGATCTAATAAAGGTTTATGGATATGCTAAAATGGAGGTTTCTGATTTATATGTAACAGGTGCTGATGATAAAGACTATAGTATTAATGGCGGTGATATTAAAAAAGCCAAAAGCACCAATAATGAAAAAGGAACTATGTACGACTATGAAAAGGTTGTTGAGTTTCTAAGCACAACGACAAGTAAGACTAATTTGACACAGAAACCCTTGACTTACTCACAGGAGCTTGCAAACAAGTCTAATAATATTTCAATGTTCCAAGCAAGCAGGTTAGTTAACGCGTATATTAGCAATGCTTACAATCTTACCGAAGTTGTTTATAATGATATTATGAATACGGACCAAGGCGGGGGTCAGGCAAATACAGGTACGCATAAGCTTAGCTATACAGAGGTTTCAAAGTTTATTAAGAGTTCTAGTAATTTGTCTGATTTTCTTACTAAATCGAAGCCCTACTTTAAAAACGTTTCTGACGAAGAGCTAACTGCTATCTATAATGCATCAGAAAGTGGTAAAATAGATAAGAAGGCATATGATACAGCAGTTAAGAACTATGACAAGACAGATTCTGGTGAAAAGTCAACTAGCTCATTGCTAGACACAGACTTTTTTCAAACAACTTTGTATAACTGGTATGCCAACAACGTTAATTTTTTGTCAGGGACTATTACAATCCTTGGAGATCCTGATATAAGAATTGGTACAATATTAAATGATGCCTATGACCACATTAGATATTATATTGAGTCAGTATCGCACACTTTCTCCTTTACAGAAGGTTTTCAAACAGAGATTGGCGTTACTAGAGGACTTACATATCAAGACGGTCAATATGATCCGAGATTCACGGCTACGTATATGTGGGGTACTGGAATAGATTACCAAGGTGGGTATATGGGTGAAGCTCCTGTTAACTACCTTGCTATTGATGGATCTGGTGGAGATGGAAATGATAGCTCTGATGGATCCGGTGCATTTTCAGGTGATGCTGGCCCAGCAACGGCTGTAAAAGCCGCTAAGTATGGGGCAACTTTTGAAAAGTCTAAGTGCAAAAGATCCGAGTGGTATGTATGGGGTGGCGGCCATGGCGGTGGTAACATCTTGGAGTCAAGTGAAGATCCAATAAAGCTTGATTGTTCAGGATTTATATCTGCTTGTTTTAACCATGTTGGTCTTAATATTAATGGTACTACTTGGACATTTAATGATAGTTCATTGTTCACGCATGTTCCTATTCCGTCTACTAGCACAGATGGAATGAAAATTGGTGATTGTGTCCTGCTTTATGGTTGTAACCATATTATGTTTTACGTTGGGGGAGGAAAACTAATGGGTTGGAATGGCAATCCCCCAACAGATACAAGCGGTGGCTGTAAGATAGTCACCTTGTCAGATATGCAGGGACATCACGATGGATATGTTTTAAGATTGAAGGGATAA

Gene Ontology

Description Category Evidence (source)
GO:0001897 symbiont-mediated cytolysis of host cell Biological process Inferred from Electronic Annotation (InterPro)
GO:0008234 cysteine-type peptidase activity Molecular function Inferred from Electronic Annotation (UniProt)

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID: upi0001998ce9_model

Method: AlphaFold3 Non-commercial

Resolution:

Chain position: A