La Protein Data Bank (PDB) è una raccolta di informazioni sulla struttura tridimensionale (3-D) di grandi molecole biologiche, come proteine e acidi nucleici. Biologi e biochimici di tutto il mondo inviano i dati. La maggior parte dei dati proviene dalla cristallografia a raggi X o dalla spettroscopia NMR. Chiunque può accedere al PDB gratuitamente online. Il Worldwide Protein Data Bank, wwPDB, gestisce il PDB.
Il PDB è utile per gli scienziati che studiano la biologia strutturale e la genomica strutturale. Molti scienziati devono inviare le loro informazioni al database. Le principali riviste scientifiche e alcune agenzie di finanziamento, come il National Institutes of Health negli Stati Uniti hanno regole che dicono agli scienziati di inviare i dati al PDB. Il PDB ha i dati originali o primari. Centinaia di altri database riutilizzano i dati. Questi database secondari organizzano le informazioni in modi diversi. Per esempio, sia SCOP che CATH mettono le strutture in gruppi organizzati per tipo di struttura e idee su come sono collegate attraverso l'evoluzione. L'ontologia genica mette i dati in gruppi basati sui geni.