Información

¿Por qué se requiere la digestión con tripsina para los estudios proteómicos?

¿Por qué se requiere la digestión con tripsina para los estudios proteómicos?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Sé que la tripsina se usa para estudios proteómicos, pero no entiendo por qué la digestión de tripsina es necesaria / importante.


La digestión con tripsina le permite cortar proteínas en polipéptidos más pequeños, masas de las cuales se pueden determinar mediante espectrometría de masas y luego volver a traducirse en posibles secuencias de aminoácidos. La tripsina se escinde después de aminoácidos específicos. En conjunto, esto le permite identificar proteínas.


Análisis proteómico cuantitativo de vesículas extracelulares tratadas con tripsina para identificar las proteínas vesiculares reales

Las vesículas extracelulares (VE) son vesículas de tamaño nanométrico rodeadas por una bicapa lipídica y liberadas al medio extracelular por la mayoría de las células. Aunque se han establecido varios métodos de aislamiento de EV, la mayoría de los métodos actuales aíslan los EV con proteínas no vesiculares contaminadas. Mediante la aplicación de los análisis proteómicos cuantitativos sin marcaje de los vehículos eléctricos derivados de SW480 de células de cáncer de colon humano, identificamos proteínas vesiculares sensibles a tripsina y resistentes a tripsina. Más análisis de biología de sistemas y redes de interacción proteína-proteína basados ​​en su localización celular, clasificamos las proteínas vesiculares sensibles a tripsina y resistentes a tripsina en dos subgrupos: 363 proteínas vesiculares reales candidatas y 151 proteínas no vesiculares contaminadas. Además, los análisis de redes de interacción de proteínas mostraron que las proteínas vesiculares reales candidatas se derivan principalmente de la membrana plasmática (46,8%), el citosol (36,6%), el citoesqueleto (8,0%) y la región extracelular (2,5%). Por otro lado, la mayoría de las proteínas no vesiculares contaminadas derivan del núcleo, aparato de Golgi, retículo endoplásmico y mitocondrias. Además, los complejos de proteínas ribosomales y las proteínas del complejo T se clasificaron como proteínas no vesiculares contaminadas. En conjunto, nuestro enfoque proteómico digerido con tripsina en los vehículos eléctricos es un avance importante para identificar las proteínas vesiculares reales que podrían ayudar a comprender la biogénesis de los vehículos eléctricos y el mecanismo de clasificación de la carga de proteínas durante la liberación de los vehículos eléctricos, para identificar proteínas marcadoras de diagnóstico de vehículos eléctricos más confiables y para decodificar las funciones fisiopatológicas de los vehículos eléctricos.


Fondo

El saltahojas del té verde Empoasca (Matsumurasca) onukii Matsuda (Hemiptera: Cicadellidae) es una plaga de insectos importante de la planta del té. Camellia sinensis (L.) O. Kuntze (Theaceae) en países productores de té de Asia [1, 2, 3]. E. onukii fue identificado previamente como dos especies, E. onukii y E. vitis. Un estudio detallado reciente de las características morfométricas sugiere que E. onukii y E. vitis pertenecen en realidad a la misma especie [3]. E. onukii daña las plantas de té al perforar los capullos de té, las hojas y los brotes tiernos con un estilete en forma de aguja para succionar la savia, lo que típicamente resulta en un síndrome llamado quemadura de la tolva que reduce drásticamente el rendimiento y la calidad de las hojas de té [1]. Las pérdidas económicas anuales causadas por este insecto podrían alcanzar el 50% solo en China [4]. Actualmente, la gestión de E. onukii la infestación depende en gran medida de la aplicación de pesticidas químicos. Sin embargo, los plaguicidas químicos pueden generar resistencia a los plaguicidas y causar efectos perjudiciales para el medio ambiente y la salud humana [5,6,7,8]. Controles biológicos de E. onukii También se han informado, pero muestran un éxito muy limitado [9,10,11]. Conocimiento de la bioquímica y fisiología del sistema de ingestión de E. onukii puede estimular el desarrollo de nuevas estrategias de manejo para esta grave plaga de insectos.

Los insectos hemípteros fitófagos han desarrollado piezas bucales perforadoras-chupadoras para la alimentación de la savia. Hay tres tipos de conductas de alimentación de la savia de las plantas: alimentación de la vaina salival fitófaga, alimentación con bomba osmótica y alimentación por ruptura celular [12, 13]. Los estudios sobre la actividad del estilete sugieren que E. onukii Es un típico alimentador de ruptura celular que secreta enzimas en los tejidos vegetales a través de su estilete y luego se alimenta de mesófilo o células madre del parénquima [1, 14]. La alimentación mediante perforación y succión requiere la inyección de enzimas digestivas secretadas por la glándula salival (SG) en las plantas para la digestión extraoral. Por lo tanto, una investigación detallada sobre las composiciones de proteínas salivales ayudaría a comprender la fisiología de los sistemas digestivos de los insectos hemípteros y potencialmente conduciría al desarrollo de estrategias novedosas para controlar estas plagas de insectos.

Los perfiles de proteínas salivales se han estudiado tanto a nivel transcriptómico como proteómico para una amplia gama de insectos hemípteros, incluidos chinches, pulgones, chicharritas y chicharritas [15,16,17,18,19,20,21,22,23]. El perfil proteómico salival ha revelado que la saliva de los insectos hemípteros contiene principalmente varias familias de enzimas, incluidas las oxidorreductasas, hidrolasas, transferasas, proteínas de unión a Ca 2+ y proteasas / peptidasas [15, 18, 20, 24, 25]. Sin embargo, la mayoría de esos primeros estudios identificaron solo grupos de proteasa pero no especies de proteasa debido a la falta de información genómica.

El análisis transcriptómico junto con el perfil proteómico es una estrategia eficaz para identificar proteínas funcionales en la SG y el intestino de los hemípteros [21, 26]. Por ejemplo, proteasas en el SG y el intestino de dos devastadores chinches pentatómidos, Halyomorpha halys y Nezara viridula, fueron investigados para identificar proteasas altamente expresadas en cada tejido [21, 26]. Además, el mapeo de las transcripciones SG de H. halys a los perfiles de proteínas de la saliva acuosa, que es la saliva secretada en las plantas hospedadoras, se revelaron 22 proteasas digestivas abundantes. Además, la mayoría de estas transcripciones de proteasa estaban altamente acumuladas en la glándula salival principal (PSG) de H. halys y N. vididula. Estos resultados indicaron que en ambas chinches apestosas, las PSG eran las principales fuentes de liberación de proteasas en la saliva [21].

Aunque las proteasas y nucleasas que participan en las actividades digestivas extraorales se han investigado previamente en la SG y el intestino de algunos insectos hemípteros, el conocimiento sobre la composición de las proteasas en los tejidos digestivos de E. onukii todavía es limitado. Anteriormente analizamos los datos de secuenciación del transcriptoma derivados del intestino de E. onukii, y se identificaron transcripciones putativas que codifican proteínas de proteasas digestivas, enzimas de desintoxicación y factores de respuesta inmune [27]. En el presente estudio, ampliamos nuestra investigación a los análisis transcriptómicos y proteómicos de la SG y el intestino de E. onukii para investigar la expresión específica de tejido de proteasas. Además, también comparamos la abundancia de proteasas en el SG y el intestino de varios hemípteros para evaluar proteasas comunes en todas las especies. Los resultados de este estudio no solo proporcionarán información para una mayor comprensión de la interacción entre E. onukii y plantas de té, sino que también ayudan en el estudio de los cambios aromáticos en las plantas de té después de la infestación con E. onukii. Identificación y análisis de las proteasas digestivas en el SG y el intestino de E. onukii también ayudará en el desarrollo de estrategias novedosas para el manejo de esta importante plaga.


Modificaciones postraduccionales que modulan la actividad enzimática

Ryan R. Dyer,. Renã A.S. Robinson, en Métodos en enzimología, 2019

5.1 Proteómica de escopeta

La proteómica de escopeta es el análisis de mezclas complejas de péptidos (Yates, 1998). Un análisis de escopeta típico implica el tratamiento experimental de las proteínas de interés, la separación por cromatografía líquida (LC), el análisis por espectrometría de masas en tándem (MS / MS) y el análisis de datos con software bioinformático. El análisis típico de MS y MS / MS identifica el péptido completo masa para cargar (m / z) ratios y m / z proporciones de fragmentos de péptidos que permiten la determinación de la secuencia de péptidos (Zhang, Fonslow, Shan, Baek y amp Yates, 2013). Se han desarrollado una variedad de estrategias proteómicas de escopeta para la cuantificación relativa de PTM de cisteína. El marcaje isotópico implica la modificación química de péptidos diana con reactivos sintetizados para contener isótopos ligeros o pesados. Como estos marcadores son químicamente idénticos pero poseen diferentes masas, la diferencia de masa se puede detectar dentro de la EM y así distinguir grupos experimentales en una muestra combinada (Hsu, Huang, Chow, & amp Chen, 2003). Las etiquetas isobáricas como la etiqueta de masa en tándem (TMT) implican la unión de múltiples grupos químicos isobáricos que producen iones de masa únicos durante el análisis MS / MS (Thompson et al., 2003). Como se muestra en la Fig.2 A, TMT consta de tres grupos: un grupo reactivo de proteína para la unión a aminas primarias (o tioles de proteína, que se muestran en la Fig.2 B), un informador de masa para producir un ión de masa único durante el análisis de MS, y un normalizador de masas para garantizar que cada etiqueta posea la misma masa exacta (Thompson et al., 2003). Los reactivos TMT se basan en la ubicación de isótopos pesados ​​dentro de su estructura molecular. Solo el grupo informador de masas se escinde y detecta durante el análisis de MS, por lo que cada etiqueta logra una masa de iones informadores única al aumentar el número de isótopos pesados ​​en el grupo informador de masas mientras se reduce el número de isótopos pesados ​​en el grupo normalizador de masas (Dayon et al. ., 2008). El etiquetado isotópico y el etiquetado isobárico permiten así la cuantificación relativa en múltiples grupos experimentales en una sola muestra. Los métodos proteómicos de escopeta dirigidos a los PTM de cisteína han incorporado estas técnicas.

Figura 2 . Estructura de las etiquetas de masa en tándem (TMT). TMT consta de un reportero de masas, un normalizador de masas y un grupo reactivo de amina (A). Los reactivos TMT reactivos con Cys, como iodoTMT (B), reemplazan el grupo reactivo con amina por un grupo reactivo con tiol.


Estudios proteómicos de células madre

Las células madre de origen embrionario y adulto son muy prometedoras en la medicina regenerativa debido a sus propiedades únicas de autorrenovación ilimitada y diferenciación hacia linajes específicos una vez que reciben las señales adecuadas. La proteómica es una serie de plataformas tecnológicas impulsadas por avances en espectrometría de masas y bioinformática que abarcan la identificación de proteínas, la cuantificación relativa de proteínas y péptidos, su localización subcelular y estudios de modificaciones postraduccionales e interacciones proteína-proteína. La biología de las células madre se ha visto influenciada por estos enfoques y ha evolucionado en la era posterior a la genómica. Entre los muchos desafíos en la biología de las células madre, existe una necesidad urgente de implementar aplicaciones proteómicas. Un trabajo reciente sobre células madre que utilizan proteómica ha demostrado que los análisis de transcriptomas no proporcionan una guía completa para el cambio en el desarrollo de las células madre, y las interacciones de proteínas que solo pueden descubrirse sistemáticamente mediante enfoques proteómicos han producido nuevos conceptos importantes sobre los procesos que regulan el desarrollo y la pluripotencia de las células madre. . En este capítulo, revisaremos los estudios proteómicos actuales sobre células madre embrionarias y adultas con énfasis en las células madre embrionarias.

1. Introducción

1.1. Células madre y proteómica

Las células madre de cualquier tipo se definen por dos propiedades distintas. La primera es la autorrenovación indefinida, una característica que proporciona el mantenimiento en un tejido y / u organismo durante un período de tiempo prolongado. El segundo es la capacidad de diferenciarse en varios tipos de células hijas diferentes, a diferencia de las células no madre que están comprometidas con un solo linaje. Las células madre somáticas adultas se encuentran en la mayoría de los órganos y tejidos de los organismos adultos y se cree que funcionan en el mantenimiento y / o reparación de tejidos a largo plazo. Por el contrario, las células madre embrionarias (ESC) se derivan de embriones y son únicas en su capacidad para mantenerse in vitro en un estado pluripotente, es decir., capaz de recapitular las tres capas germinales y un organismo completo.

Tanto las células madre adultas como las embrionarias han proporcionado distintos desafíos para el análisis. Las células madre adultas tienden a ser raras, difíciles de purificar o mantener en cultivo. Por esta razón, las células madre adultas han supuesto un mayor desafío técnico para los análisis de proteomas y transcriptomas a gran escala. Las ESC, por el contrario, se cultivan fácilmente en grandes cantidades en cultivo y se han utilizado para un análisis extenso mediante perfiles transcripcionales y otras técnicas de genoma amplio. Además, los ESC se manipulan fácilmente in vitro, lo que las convierte en herramientas ideales para sondear las propiedades y características de las células madre utilizando una amplia variedad de técnicas. En la era post-genómica actual, en la que el mapeo de transcriptomas usando tecnología de microarrays de ADN es común (Ivanova et al., 2002 Ramalho-Santos et al., 2002), la consideración del transcriptoma solo ofrece una interpretación incompleta y sesgada del tallo subyacente. biología celular (Evsikov y Solter, 2003: Fortunel et al., 2003). Los problemas inherentes asociados con este enfoque de perfil transcripcional incluyen, en primer lugar, que el análisis se limita obviamente a los genes presentes en la micromatriz, y es posible que haya genes de "tallo" que aún no se han identificado y que no están representados en los chips utilizados en segundo lugar. , los cambios en el nivel de ARNm pueden no ser proporcionales a los cambios en la expresión de proteínas (Gygi et al., 1999a) tercero, la formación de complejos de proteínas, numerosas modificaciones postraduccionales (PTM) y la degradación de proteínas tienen un gran impacto en las interacciones proteína-proteína y proteína-ADN , lo que hace que la salida funcional de estos sistemas sea prácticamente imposible de predecir basándose únicamente en la expresión génica y / o datos genómicos.

El término "proteoma" fue acuñado originalmente por Wilkins. et al. (Wilkins et al., 1996) para describir el conjunto total de proteínas expresadas en una población dada, también conocido como. célula, tejido, orgánulo, organismo o estado patológico. El término "proteómica" se refiere a un conjunto de técnicas adecuadas para identificar proteomas, pero se ha ampliado para incluir técnicas a gran escala capaces de identificar proteínas y analizar tanto sus estructuras como sus funciones a nivel de todo el genoma. La proteómica abarca una amplia variedad de técnicas, que van desde pantallas de dos híbridos de levadura para identificar interacciones proteína-proteína (Rual et al., 2005), chips de proteínas basados ​​en anticuerpos para identificar proteínas (MacBeath, 2002) y pantallas de cristalografía de alto rendimiento ( Stevens et al., 2001) para proporcionar un análisis estructural. Todas estas técnicas (ver resumen en la Figura 1) brindan información invaluable sobre el proteoma y su función en una célula, pero quizás el grupo de técnicas más ampliamente utilizado se centra en la espectrometría de masas (MS), que se discutirá más adelante (también revisado) en Aebersold y Mann (2003) y Cravatt et al. (2007)).


Se destacan las ventajas y desventajas de los diversos métodos que se han utilizado en el perfil proteómico y el mapeo del interactoma de proteínas. UNA. La electroforesis bidimensional (2-DE) seguida de análisis de espectrometría de masas (MS) se ha utilizado ampliamente para comparar varias poblaciones de células madre con tipos de células más diferenciadas. B. iTRAQ (etiquetas isobáricas para cuantificación relativa y absoluta) e ICAT (etiquetas de afinidad codificadas por isótopos) son dos enfoques de etiquetado químico que se han utilizado antes del análisis de espectrometría de masas en tándem (MS / MS) en comparación con poblaciones de células madre purificadas. C. SILAC (marcaje de isótopos estables con aminoácidos en cultivo) es un enfoque de marcaje metabólico que se ha utilizado en estudios de perfiles proteómicos y fosfoproteómicos cuantitativos. D. La purificación basada en afinidad de complejos de proteínas seguida de análisis MS / MS se ha utilizado ampliamente en estudios de interactomas de proteínas. MI. El uso de matrices de proteínas funcionales es un enfoque muy prometedor que se ha utilizado predominantemente en estudios de interactomas de proteínas de levadura.

1.2. Plataformas basadas en espectrometría de masas (MS) para la investigación proteómica

La MS funciona ionizando moléculas relativamente pequeñas y luego midiendo su relación masa / carga (m / z). Si bien la EM tradicional en sí misma es capaz de identificar la masa de moléculas pequeñas altamente purificadas, poco más puede hacer con moléculas más complicadas (como péptidos) o mezclas de muestras. Para aumentar aún más la gama de sustancias que pueden ser identificadas por MS, se pueden combinar dos en tándem (denominado MS / MS) en el que primero se mide la masa molecular de un péptido (en MS1) y luego se bombardea con gases electro-neutros para causar fragmentación. los m / z A continuación, se miden las proporciones de estos fragmentos más pequeños resultantes en el segundo analizador (MS2) y, tras el análisis informático, se puede determinar la secuencia de aminoácidos del péptido (véase la Figura 2). Por tanto, virtualmente cualquier péptido individual, en un estado relativamente purificado, puede identificarse usando EM en tándem. Para el análisis de una proteína completa, o incluso de múltiples proteínas, se necesitan más manipulaciones para purificar la mezcla y reducir la complejidad de cualquier entrada específica en la EM. Por lo general, esto se logra primero purificando una muestra mediante electroforesis SDS-PAGE simple y la posterior escisión de las bandas relevantes o una línea completa de un gel que luego se descompone en fragmentos más pequeños. Estos fragmentos de gel luego se digieren en el lugar con una proteasa (típicamente tripsina) y se recuperan los péptidos. Para fraccionar aún más la muestra antes del análisis por MS, las muestras se someten a cromatografía líquida unidimensional (LC, generalmente una LC de fase inversa que se separa en función de la hidrofobicidad), o multidimensional (LC / LC), con la elección basada en la complejidad de la muestra inicial. Posteriormente a la LC o LC / LC pero antes de la aplicación al analizador de masas, los péptidos se ionizan, generalmente mediante ionización por electropulverización en la que se aplica un potencial a través de una aguja fina a través de la cual pasa el eluido de la columna de LC, creando una pulverización fina que forma gotitas que contienen la muestra, y el calor aplicado antes de entrar en el MS permite la desolvatación y la ionización. El análisis MS / MS asegura la identificación del tamaño del péptido y la secuencia de aminoácidos.


Los extractos de proteínas se elaboran a partir de células madre de cualquier tipo y primero se fraccionan mediante SDS-PAGE. Las bandas individuales o todo el carril se someten a en el lugar digestión con tripsina. Después de la digestión con tripsina, el producto se somete a cromatografía líquida unidimensional (LC) o multidimensional (LC / LC) para una mayor separación de la mezcla. Luego, el eluido de LC se ioniza mediante ionización por electropulverización, y cada pico de eluido pasa primero a través de un MS (típicamente MS2) para la determinación de la masa. Luego, cada pico se separa en MS1 ​​y pasa a una cámara de colisión donde se fragmenta y se analiza posteriormente en MS2, lo que ayuda en la determinación de la secuencia de péptidos.

Una vez completado este proceso, una mezcla de proteínas complicada se reduce a un espectro de iones de fragmentos y un peso molecular para cada péptido. La bioinformática es entonces necesaria para traducir cada espectro específico en un péptido y una proteína de los que surgió originalmente. Los algoritmos involucrados son variados y complejos, pero se basan en la comparación con el espectro teórico de proteínas conocidas de una base de datos y de novo secuenciación en la que cada espectro de fragmentos se traduce directamente en un péptido específico, o un enfoque híbrido que combina ambos (revisado en (Nesvizhskii et al., 2007). Luego, cada péptido se asigna a una proteína basada en un determinista (es decir., un algoritmo predeterminado como en (Resing et al., 2004: Tabb et al., 2002) o probabilidades de coincidencia (Price et al., 2007). El resultado es una identificación de todas las proteínas posibles en una muestra determinada.

El uso de MS / MS en tándem acoplado a LC ha permitido dos enfoques generales. La primera se denomina proteómica de "disparo rápido", en la que se analiza una sola muestra, como una línea celular, tejido o población celular altamente purificada para evaluar todos los péptidos / proteínas expresados. Esto también se conoce como proteómica basada en la expresión. La segunda es la purificación por afinidad, en la que se purifica una única especie de proteína de una célula con el objetivo de identificar moléculas asociadas (ver Figura 1D). Si bien ambos métodos se han utilizado ampliamente, la purificación por afinidad ha proporcionado conocimientos únicos sobre las propiedades de red de los organismos (Gavin et al., 2002) y las células madre (consulte la Sección 2) y, por lo tanto, a menudo se la denomina proteómica funcional (Kocher y Superti. Furga, 2007). En general, la purificación por afinidad se basa en dos técnicas. Primero, la purificación por afinidad se puede realizar en proteínas nativas usando anticuerpos para aislar una sola proteína y sus proteínas asociadas (Uhlen y Ponten, 2005). El principal inconveniente es que el anticuerpo a menudo puede ser el reactivo limitante, lo que dificulta la purificación de proteínas raras o una gran cantidad de complejos. El segundo implica unir una etiqueta peptídica específica a un ADNc de interés, lo que permite una fácil purificación y elución de la proteína etiquetada de interés (Rigaut et al., 1999). Estos métodos también permiten típicamente eluir los complejos marcados por afinidad de la columna mediante escisión proteolítica en una secuencia de reconocimiento específica (por ejemplo, etiqueta TAP en la Figura 3A). Una variación de esta técnica basada en etiquetas se basa en el marcado metabólico con biotina (de Boer et al., 2003). Se generan células que expresan el E. coli ligasa BirA derivada capaz de unir biotina a una secuencia de reconocimiento de péptidos específica. Luego, los ADNc se diseñan para contener la secuencia de reconocimiento, lo que les permite biotinilarse de manera eficiente. en vivo y capturado in vitro debido a la fuerte afinidad de la biotina por la estreptavidina (ver Figura 3B). La ventaja predominante de los métodos de marcado metabólico es la afinidad excepcionalmente alta de la estreptavidina por la biotina (KD ≈ 10 −15, en contraposición a una KD ≈ 10 -9 para la proteína de unión a calmodulina). Utilizando cualquiera de los enfoques de etiquetado, las etiquetas se combinan a menudo para permitir la purificación en tándem, aumentando así la pureza del complejo y la especificidad de las interacciones identificadas posteriormente. Hay varias ventajas asociadas con este método de purificación por afinidad-MS: en primer lugar, se puede realizar en condiciones relativamente fisiológicas, en segundo lugar, no suele perturbar los PTM relevantes, que a menudo son cruciales para la organización y / o actividad de los complejos y también pueden ser identificado por MS en tercer lugar, puede usarse para sondear cambios dinámicos en la composición de complejos de proteínas cuando se usa en combinación con técnicas de proteómica cuantitativa como iTRAQ y SILAC (ver más abajo).


UNA. Cromatografía de afinidad en tándem: primero se diseña una proteína de interés para que contenga una etiqueta de proteína A (con un círculo), un sitio de reconocimiento del virus del eco del tabaco (TEV, con un triángulo) y una etiqueta con péptido de unión a calmodulina (CBP) (con una elipse) ). Los extractos se elaboran a partir de células que expresan la proteína etiquetada, que debe contener proteínas y contaminantes asociados. Estos complejos se unen a una columna de IgG y se lavan para eliminar la mayoría de los contaminantes. A continuación, se usa la proteasa TEV para eluir los complejos proteicos semipurificados que posteriormente se absorben en una columna de calmodulina. Después de un lavado adicional, los complejos de proteínas purificadas que contienen la proteína de interés y sus proteínas asociadas se eluyen mediante quelación de calcio (EGTA) y se identifican usando LC-MS / MS.


B. Marcado metabólico para cromatografía de afinidad: primero, las células madre se diseñan para expresar la E. coli biotina-ligasa BirA derivada, que une biotina a una secuencia de reconocimiento definida, que se muestra con una estrella rellena. A continuación, las proteínas de interés se modifican mediante ingeniería genética con un sitio de biotinilación y un epítopo FLAG (mostrado como un círculo relleno). Dentro de la célula madre, BirA agrega la biotina (círculo azul). Se preparan extractos de proteínas y se aplican a una columna de FLAG-anticuerpo, y después de lavar los complejos semipurificados se eluyen con péptido FLAG. A continuación, el eluido se aplica a una columna de estreptavidina y, después de lavar, la proteína purificada de interés y sus proteínas asociadas se eluyen por desnaturalización y se identifican mediante LC-MS / MS.

Además de identificar grandes matrices de proteínas, así como complejos de proteínas, la proteómica también ha avanzado para ser más cuantitativa, es decir., permiten comparar directamente los niveles de proteína entre dos muestras (Oda et al., 1999: Ong et al., 2003). Si bien hay una serie de técnicas (resumidas en la Figura 1A-C), dos son las más utilizadas: ICAT (etiquetas de afinidad codificadas por isótopos Gygi et al. 1999b) e iTRAQ (etiquetas isobáricas para cuantificación relativa y absoluta) (Ross et al. , 2004). Brevemente, las proteínas de dos poblaciones de células se marcan utilizando diferentes productos químicos con diferentes composiciones de isótopos (es decir., hidrógeno vs. deuterio en el caso de ICAT o una etiqueta análoga de cuatro isótopos en iTRAQ), y luego se vuelven a mezclar las muestras y se pueden evaluar los niveles cuantitativos de proteína. Las ventajas de estas técnicas son que ambas permiten la cuantificación de prácticamente cualquier muestra y son posibles muestras muy grandes, aunque los problemas con la eficiencia del etiquetado y el sobreetiquetado pueden causar dificultades. Por el contrario, SILAC (marcaje de isótopos estables con aminoácidos en cultivo Chen et al. 2000: Ong et al., 2002: Zhu et al., 2002) utiliza un enfoque similar en el que dos poblaciones de células se marcan con aminoácidos isotópicamente distintos. en vivo y luego analizados, lo que permite evaluar las diferencias entre las dos poblaciones de células. La ventaja de esta técnica es que la eficiencia del etiquetado y el sobreetiquetado ya no son un problema, aunque es un procedimiento difícil de escalar a procedimientos de mayor escala de proteomas. El desarrollo de estas plataformas de técnicas basadas en EM ha avanzado enormemente en los estudios proteómicos de las células madre, que se discuten en detalle en las dos secciones siguientes.

2. Estudios proteómicos de células madre embrionarias (ESC)

2.1. El proteoma ESC

Desde su descubrimiento hace más de 25 años (Evans y Kaufman, 1981), las células madre embrionarias murinas (mESC) han proporcionado una herramienta invaluable para responder preguntas genéticas (Thomas y Capecchi, 1987). Con el establecimiento de células madre embrionarias humanas (hESCs Thomson et al. 1998), se están explorando activamente nuevas oportunidades para la reparación o reemplazo de tejidos. Para complementar los análisis transcriptómicos de las ESC que definen una firma de expresión de ARN en todo el genoma de tallo (Ivanova et al., 2002: Ramalho-Santos et al., 2002), la proteómica de células madre proporciona una herramienta excelente para caracterizar las ESC a nivel de proteína y derivar una firma de pluripotencia de proteínas que puede revelar nuevos puntos de referencia específicos de ESC.

El análisis proteómico del tallo embrionario se ha probado utilizando perfiles de proteínas basados ​​en MS de ESC tanto indiferenciados como diferenciados. Una búsqueda de proteínas específicas de ESC humana (línea HES-2) y de ratón (línea D3) dio como resultado 1775 proteínas no redundantes en hESC, 1532 en hESC diferenciadas, 1871 en mESC y 1552 en mESC diferenciadas con una tasa de falsos positivos de & lt0,2%. La comparación de los conjuntos de datos distinguió 191 proteínas identificadas exclusivamente en ESC de humanos y de ratón, muchas de las cuales son proteínas no caracterizadas y son potenciales marcadores específicos de ESC novedosos o proteínas funcionales (Van Hoof et al., 2006). Elliott y col. utilizaron geles 2D con múltiples gradientes de pH y concentraciones variadas de acrilamida para resolver aproximadamente 600∼1000 manchas de proteína de ESC R1 de ratón en geles teñidos con plata y representa el paso inicial en la producción de una base de datos completa de proteínas ESC 2D (Elliott et al., 2004). Nagano y col. utilizando una LC-MS / MS 2D a microescala automatizada, se analizaron las proteínas totales en las ESC de E14-1 de ratón (Nagano et al., 2005). Reunieron un catálogo que consta de ∼1800 proteínas, que contiene muchos componentes derivados de genes específicos de ESC y de tallo definidos por el análisis del transcriptoma (Ramalho-Santos et al., 2002), y una serie de componentes, como Oct4 y UTF1, que se expresan específicamente en ESC. Es importante destacar que detectaron factores de transcripción específicos de ESC de baja abundancia (104 a 105 copias / célula) y encontraron que el 36% de las proteínas totales estaban ubicadas en el núcleo, lo que concuerda con la alta proporción nuclear a citoplasmática de las colonias de ESC.

Recientemente, Graumann et al. fraccionó el proteoma ESC marcado con SILAC mediante 1D / IEF (enfoque isoeléctrico) seguido de un análisis de alta resolución en un instrumento de trampa de iones lineales-orbitrap (LTQ-Orbitrap) con una precisión de masa de menos de ppm, lo que resultó en una identificación y cuantificación confiables de más de 5,000 proteínas distintas (Graumann et al., 2007). Este es el proteoma cuantificado más grande informado hasta la fecha y contiene marcadores de células madre prominentes, como Oct4, Nanog, Sox2, Utf1 y una versión embrionaria de Ras (ERas). El análisis bioinformático del proteoma ESC revela una amplia distribución de funciones celulares con sobrerrepresentación de proteínas implicadas en la proliferación. Además, Graumann et al. compararon el proteoma con un mapa publicado recientemente de los estados de cromatina de los promotores en las ESC (Mikkelsen et al., 2007) y encontraron una excelente correlación entre la expresión de proteínas y la presencia de marcas de cromatina activas y represivas.

Una característica interesante del proteoma ESC en el estudio de Nagano (Nagano et al., 2005) y otro estudio en D3 ESCs (Nunomura et al., 2005) es que retiene los marcadores de superficie celular y las moléculas de señalización que son características de las células diferenciadas. . Esto no es incompatible con la noción de que las interacciones entre las proteínas de la superficie celular y los ligandos extracelulares son clave para iniciar la diferenciación de ESC a un linaje específico. Aunque anteriormente era posible que una pequeña porción de células se diferenciara a una variedad de linajes celulares durante la condición de cultivo, es tentador suponer que el proteoma de ESC está equipado con múltiples componentes proteicos únicos para varios tipos de células diferenciadas, lo que permite a las células para responder a varias señales externas que conducen a la diferenciación de linajes específicos, una propiedad de la pluripotencia de los ESC. Hasta ahora, se sabe relativamente poco sobre cómo se programan las células madre para un linaje celular en particular. Esta es un área importante de investigación que involucra la diferenciación dirigida para influir en el compromiso de linaje de estas células pluripotentes. in vitro. La manipulación de señales extracelulares y la sobreexpresión de factores de transcripción pueden llevar a las ESC a comprometerse con un tipo celular específico, sin embargo, en última instancia, son los cambios en la expresión nuclear los que dirigen la diferenciación hacia un linaje específico. En consecuencia, se ha propuesto la proteómica nuclear (estudios de acciones colectivas e interacciones de proteínas que se encuentran en el núcleo) (Barthelery et al., 2007) para inventariar proteínas nucleares en células tanto indiferenciadas como diferenciadas y descifrar su dinámica durante el compromiso fenotípico celular. Esto brinda la oportunidad de identificar factores de transcripción desconocidos y efectores nucleares adicionales críticos en el mantenimiento del fenotipo celular. Además, ofrece información sobre qué perfil nuclear se necesita para programar o reprogramar el destino celular con efectos secundarios de impronta limitados (Barthelery et al., 2007).

2.2. El epiproteoma ESC

Para identificar proteínas biológicamente relevantes importantes para la autorenovación y la pluripotencia de las células madre, el catálogo extenso y la referencia de las bases de datos de proteínas no son suficientes. Muchas vías bioquímicas están dirigidas por cambios en las PTM, como la fosforilación, más que por cambios en la abundancia de las proteínas mismas. Los estudios ahora han demostrado que los mecanismos epigenéticos, como las modificaciones covalentes de las histonas y la metilación del ADN, son de vital importancia para la naturaleza pluripotente de las ESC y que estos mecanismos también regulan la diferenciación (Atkinson y Armstrong, 2008). Se ha demostrado que la naturaleza epigenética de las ESC (el “epigenoma” de las ESC) es única y sus características se han relacionado estrechamente con la permisividad global de la expresión génica y la pluripotencia (Niwa, 2007). En analogía con el epigenoma, se ha acuñado un nuevo término "epiproteoma" para reflejar un panorama proteico de PTM y variantes de histonas (Dai y Rasmussen, 2007).

La fosforilación es una PTM fundamental que participa en la modulación de la función de las proteínas. Para obtener información sobre las señales intracelulares que gobiernan la autorrenovación y diferenciación de ESC, se realizó un análisis de sistemas multivariados de datos proteómicos generados a partir de la estimulación combinatoria de mESC (línea CCE) por fibronectina, laminina, LIF y fgf4 (Prudhomme et al., 2004). Los estados de fosforilación de 31 componentes de la red de señalización intracelular se obtuvieron en 16 condiciones de estímulo diferentes en tres puntos de tiempo mediante Western blot cuantitativo, y se utilizó un modelo informático para determinar qué componentes estaban más fuertemente correlacionados con la proliferación celular y las constantes de tasa de diferenciación obtenidas a partir de las mediciones de la expresión de Oct4. niveles. El estudio identificó un conjunto de componentes de la red de señalización más críticamente asociados con la diferenciación, la proliferación de células tanto indiferenciadas como diferenciadas.

También se realizó un análisis proteómico a gran escala de las hESC (líneas BG01 y BG03) utilizando ensayos de transferencia Western PowerBlot y Kinexus junto con inmunofluorescencia (Schulz et al., 2007). El estudio identificó más de 600 proteínas expresadas en hESC indiferenciadas, incluida una serie de posibles nuevos marcadores de células madre, y destacó más de 40 posibles isoformas de proteínas y / o PTM, incluidos 22 eventos de fosforilación en moléculas de señalización celular. Más recientemente, se desarrolló un método ELISA de nucleosomas para evaluar cuantitativamente el estado de las PTM y las variantes de histonas (denominadas "firma epiproteómica") presentes en el conjunto de nucleosomas celulares totales (Dai y Rasmussen, 2007). Los resultados indican que la evaluación de los niveles de estado estacionario de PTM y macroH2A produce una firma epiproteómica que puede distinguir entre ESC, células EC y MEF. Además, las firmas de nucleosomas epiproteómicos cambian en respuesta a la exposición de las células a moléculas pequeñas como RA y TSA y en el transcurso de la diferenciación de ESC. Esto indica que las firmas epiproteómicas son útiles para la investigación de la diferenciación de células madre, función de la cromatina, identidad celular y respuestas epigenéticas a agentes farmacológicos.

El análisis directo de un gran número de péptidos usando LC-MS / MS 2D permitió la identificación sistemática de péptidos portadores de PTM (Witze et al., 2007). Nagano y col. identificaron proteínas PTM en varias proteínas ESC, incluidos cinco sitios de acetilación de Lys y un solo sitio de fosforilación (Nagano et al., 2005). El análisis de fosforproteomas de mESC indiferenciadas y diferenciadas (línea J1) usando purificación por afinidad de fosfoproteínas seguida de LC-MS / MS 2D indicó que muchas proteínas remodeladoras de cromatina están potencialmente reguladas por fosforilación (Puente et al., 2006). Curiosamente, el análisis de microarrays affymetrix indicó que los niveles de expresión génica de estas proteínas de muestra tenían una variabilidad mínima entre las muestras comparadas (Puente et al., 2006). Estos hallazgos resaltan colectivamente las funciones críticas que desempeñan los factores epigenéticos en el mantenimiento de la pluripotencia de las ESC (Bibikova et al., 2008) y enfatizan la necesidad y el valor del análisis proteómico.

2.3. La red de interacción de la proteína ESC

Los estudios basados ​​en la expresión del proteoma y el epiproteoma de ESC proporcionan un inventario completo de proteínas, así como de sus PTM, algunas de las cuales pueden usarse como marcadores de ESC. Sin embargo, tales listas de proteínas no son suficientes para describir procesos biológicos. Las funciones celulares vitales requieren la acción coordinada de una gran cantidad de proteínas que se ensamblan en una serie de complejos multiproteicos de distinta composición y estructura. El análisis de complejos de proteínas y redes intrincadas de interacción proteína-proteína es clave para comprender prácticamente cualquier sistema biológico complejo, incluidas las células madre (Levchenko, 2005).

Para comprender cómo se programa y mantiene la pluripotencia en las ESC, hemos utilizado un enfoque proteómico para aislar complejos de proteínas y hemos construido una red de interacción de proteínas que rodea al factor de pluripotencia Nanog (Wang et al., 2006). El enfoque aprovecha la extraordinaria afinidad de la estreptavidina por la biotina y evita la dependencia de anticuerpos de afinidad inherentemente más baja para la purificación (ver Figura 3B). Se ha informado que la captura de estreptavidina en un solo paso de factores de transcripción marcados es suficiente para aislar proteínas específicamente asociadas con una contaminación no específica mínima (de Boer et al., 2003). En este sistema, los ESC que expresan BirA sirven como receptores para otros ADNc marcados. Una construcción que lleva el factor de pluripotencia con una etiqueta FLAG, así como una etiqueta peptídica que sirve como sustrato para en vivo la biotinilación se expresó en ESC (ver Figura 4A). La proteína marcada se recuperó de extractos nucleares con perlas de estreptavidina junto con sus posibles socios interactuantes. Para la purificación en tándem, los extractos nucleares se sometieron primero a inmunoprecipitación con anticuerpos anti-FLAG y los complejos proteicos recuperados se purificaron adicionalmente mediante perlas de estreptavidina. Los complejos de proteínas recuperados de la purificación de estreptavidina en un solo paso o en tándem se sometieron a microsecuenciación por LC-MS / MS (ver Figura 4B).


UNA. Establecimiento de un sistema de biotinilación en ESC. Una línea ESC estable que expresa la enzima bacteriana BirA se estableció primero por transfección con un plásmido que expresa BirA que lleva el gen de resistencia a neomicina (neo r) y selección G418 Un segundo plásmido que contiene ADNc Nanog con una etiqueta dual N-terminal Flag-biotina (FLBIO ) y se introdujo un gen de resistencia a puromicina (puro r) y se seleccionaron las células con puromicina. Las líneas estables resultantes son resistentes tanto a G418 como a puromicina y expresan Nanog biotinilado marcado con FLAG que puede inmunoprecipitarse mediante anticuerpos / perlas anti-FLAG y estreptavidina. B. Dos estrategias de purificación por afinidad complementarias para la purificación de proteínas complejas. La inmunoprecipitación de estreptavidina simple y la purificación por afinidad en tándem (inmunoprecipitación anti-Flag seguida de reducción de estreptavidina) se realizaron en paralelo, los complejos proteicos purificados se fraccionaron en SDS-PAGE y se sometieron a LC-MS / MS para identificar los componentes de los complejos proteicos.

En primer lugar, decidimos centrarnos en la variante de la proteína homeobox Nanog, teniendo en cuenta su papel en el mantenimiento del estado pluripotente de las células en el embrión de ratón temprano y en la promoción de la pluripotencia de las mESC (Chambers et al., 2003: Mitsui et al., 2003). Mediante la purificación por afinidad de los complejos proteicos asociados con Nanog seguida de LC-MS / MS, se identificaron los componentes de los complejos proteicos Nanog (y, por tanto, los socios directos y / o indirectos que interactúan con Nanog).Muchos de los candidatos identificados eran otros factores de transcripción o componentes de complejos transcripcionales, algunos de los cuales ya se habían asociado con funciones de ESC en estudios anteriores. Varias novelas (p.ej., Dax1, Rif1, Nac1 y Zfp281) y conocido (p.ej., Oct4) se validaron los factores críticos, tanto física como funcionalmente, para la asociación con el cebo Nanog y se utilizaron (junto con otro marcador ESC bien conocido, Rex1) para la purificación de un segundo nivel de complejos. Los conjuntos de datos resultantes se utilizaron para generar una red compleja de proteínas que interactúan que se describe de forma concisa en la Figura 5A. Esta estrategia iterativa "de abajo hacia arriba" revela una red de proteínas estrecha, altamente interconectada, muy enriquecida en factores nucleares requeridos individualmente para el mantenimiento de las propiedades de la ESC y co-regulada en la diferenciación de la ESC (Wang et al., 2006). Además, la red se conecta a múltiples vías de correpresores, lo que proporciona tanto un medio para regular diferentes conjuntos de genes diana como un mecanismo a prueba de fallas para evitar la diferenciación hacia diferentes linajes, un requisito para la pluripotencia. Además, los objetivos genéticos posteriores de varios factores centrales de pluripotencia (p.ej., Nanog, 4 de octubre) identificados a partir de estudios previos (Boyer et al., 2005: Loh et al., 2006) también sirven como reguladores ascendentes en la red (ver Figura 5B), lo que indica que la red de interacción ESC es autónoma, módulo celular extremadamente apretado dedicado a la pluirpotencia. Finalmente, la identificación de una serie de proteínas de red que no son estrictamente específicas de las ESC y no pueden identificarse mediante el perfil transcripcional, destaca la importancia y la ventaja de los estudios proteómicos en las ESC.


UNA. Las proteínas con etiquetas rojas son cebos etiquetados para purificación por afinidad. Las líneas verdes y rojas indican interacciones confirmadas por coinmunoprecipitación o datos publicados. Las líneas punteadas indican una posible asociación. Los círculos verdes indican proteínas cuyo knockout da como resultado defectos en la proliferación y / o supervivencia de la masa celular interna u otros aspectos del desarrollo temprano Los círculos azules indican proteínas cuya reducción por RNAi (o shRNA) da como resultado defectos en la autorrenovación y / o diferenciación de ESC Los círculos amarillos son proteínas cuyo knockout da como resultado defectos posteriores del desarrollo. Los círculos blancos indican proteínas para las que no se dispone de datos de pérdida de función. También se indican dentro de la red tres complejos principales modificadores de cromatina cuyos componentes están marcados con estrellas negras (complejo de represión Polycomb 1), estrellas rojas (complejo NuRD) y una estrella azul (complejo SWI / SNF), respectivamente.


B. Los objetivos de los factores de pluripotencia están altamente representados en la red. Los paneles de la izquierda muestran los objetivos de Nanog, Oct4 y Sox2 en hESC (Boyer et al., 2005) y los objetivos de Nanog y Oct4 en mESC (Loh et al., 2006). La tabla de la derecha resume los objetivos de Nanog y Oct4 de los dos estudios de ChIP (izquierda) que están presentes en la red de proteínas (centro). Nota: X m, h indica que el gen X se identificó como dianas de Nanog y / o Oct4 en ESC de ratón (m) y humano (h). Sombreados son los objetivos tanto de Nanog como del 4 de octubre.

El objetivo final de la proteómica funcional en las células madre es descifrar la función molecular de una célula completa mediante la generación de un plan maestro de construcción que describe todas las máquinas moleculares, sus funciones para mantener las propiedades de las células madre, sus reacciones a los estímulos externos durante la diferenciación y sus interconexiones. Nuestro trabajo sobre la red de interacción de proteínas en las mESC descritas anteriormente representa el primer paso hacia esa dirección. Además, proporciona un marco para explorar las combinaciones de factores que pueden permitir la reprogramación óptima de células diferenciadas a un estado de célula ES (Wang y Orkin, 2008).

2.4. La red reguladora transcripcional de la ESC

Los análisis transcriptómicos y proteómicos a gran escala de los ESC son complementarios entre sí y han sentado las bases para una mejor comprensión de la biología subyacente de las células madre. Sin embargo, existen eslabones perdidos, como que la transcripción génica puede no ser directamente indicativa o proporcional a la lectura de la traducción de la proteína (expresión) y, a la inversa, la expresión de proteínas y los complejos multiproteicos no especifican por sí mismos la regulación del gen diana de la proteína o proteínas. Una comprensión integral del establecimiento del estado pluripotente en las ESC requiere la construcción de una red reguladora transcripcional expandida en la que muchos factores de transcripción clave además de Nanog, Oct4 y Sox2 y sus socios de interacción (Wang et al., 2006) se unen directamente a sus genes diana.

Estudios recientes han comenzado a dilucidar las redes de transcripción que rodean a los tres factores transcripcionales centrales de la ESC, Nanog, Oct4 y Sox2, que operan para controlar la pluripotencia de la ESC. Utilizando el análisis de chips de ChIP (inmunoprecipitación de cromatina seguida de hibridación de microarrays para identificar sitios de unión en una escala amplia del genoma), Boyer et al. mostró que Oct4, Sox2 y Nanog colaboran para regular la pluripotencia y la autorrenovación de hESC a través de bucles de alimentación y autorregulación. Estos tres factores de transcripción funcionan activando genes de pluripotencia incluidos ellos mismos y reprimiendo genes clave del desarrollo posiblemente en parte con la ayuda de proteínas Polycomb (Boyer et al., 2006: Lee et al., 2006). Utilizando ChIP seguido de un enfoque de ditags de extremos emparejados (ChIP-PET), Loh et al. estudiaron genes diana de Nanog y Oct4 en mESC y encontraron que ambos regulan genes diana sustancialmente superpuestos (Loh et al., 2006). Sin embargo, el examen cruzado de los genes diana de Nanog y Oct4 entre hESC y mESC reveló una superposición limitada entre los dos conjuntos de datos, lo que sugiere diferentes mecanismos de control entre las dos especies o variaciones inherentes entre las dos plataformas técnicas. El resultado que surgió de estos estudios fue el alto grado de superposición entre los genes seleccionados por pares o los tres factores de transcripción. Sin embargo, quedaban por abordar preguntas sobre cómo otros factores además de los tres en la red de interacción de proteínas (ver Figura 5A) contribuyen al mantenimiento de la identidad de las células madre y cómo los complejos multiproteicos especifican la regulación del gen diana.

Aunque ni los estudios de unión de factores de expresión ni de transcripción de forma aislada son suficientes para establecer una relación reguladora entre un factor de transcripción y sus objetivos, la integración de estas metodologías ha proporcionado dos fuentes independientes de evidencia para la predicción de alta confianza de nuevas redes transcripcionales que regulan la autorrenovación y el compromiso de ESC. (Walker et al., 2007:). Utilizando un procedimiento de chip-chip modificado (denominado biochip-chip) combinado con purificación por afinidad y LC-MS / MS (denominado bio SAIP-MS) para expandir la red de interacción de proteínas actual (ver Figura 6), Kim et al. encuestó sistemáticamente los genes diana de un total de 9 factores de la red de interacción de proteínas (Nanog, Oct4, Sox2, Klf4, c-Myc, Nac1, Zfp281, Dax1 y Rex1) y construyó una red reguladora transcripcional ampliada en mESC (Kim et al., 2008). Esta red contiene muchos más factores centrales de pluripotencia además de Nanog, Sox2 y Oct4 que forman circuitos regulatorios autorreguladores y de alimentación anticipada. En particular, Klf4 sirve como regulador aguas arriba de bucles de alimentación hacia adelante más grandes que contienen Nanog, Sox2 y Oct4, así como c-Myc. Más importante aún, los análisis combinados de los datos del chip bioChIP con los datos de expresión génica revelaron que la mayoría de los objetivos comunes de más de 4 factores son muy activos en las ESC y se reprimen tras la diferenciación. En el caso de objetivos unidos por menos factores, tanto los genes activos como los reprimidos están presentes y el equilibrio se desplaza hacia la inactividad del gen con una co-ocupación reducida del factor. El extremo es que los distintos objetivos de un solo factor están en gran parte inactivos o reprimidos. Además, la red reguladora también indica que c-Myc y otros tres factores (Nanog, Oct4, Sox2) juegan roles distintos en los ESC, es decir., c- Myc participa en gran medida en la estimulación de la proliferación celular y la regulación de la accesibilidad cromosómica, mientras que Oct4 / Sox2 / Nanog regulan positivamente los factores ESC y regulan negativamente la diferenciación (Kim et al., 2008). Esto proporciona un mecanismo potencial que podría explicar la regulación diferencial de los objetivos de los factores de transcripción en las ESC y proporciona conocimientos mecánicos sobre la reprogramación de células somáticas mediada por 4 factores (Oct4, Klf4, Sox2 y c-Myc) (Lewitzky y Yamanaka, 2007). .


Los ESC que expresan BirA solo (como control) y BirA más factores de transcripción biotinilados (bioTF) se pueden usar para el aislamiento de complejos de proteínas usando inmunoprecipitación (IP) de estreptavidina (SA) junto con LC-MS / MS (denominado bio SAIP-MS) y Mientras tanto, la construcción de una red de interacción proteína-proteína, las mismas ESC pueden ser sometidas a en vivo inmunoprecipitación de cromatina mediada por biotinilación y microarray (denominado biochip-chip) para identificar interacciones proteína-ADN y construir una red reguladora transcripcional.

Nuestra demostración de en vivo La biotinilación de proteínas marcadas y la captura por afinidad de estreptavidina para identificar dianas globales de múltiples factores involucrados en el control transcripcional de la pluripotencia en las ESC destaca aún más el poder de los enfoques proteómicos para definir de manera sistemática la interacción proteína-proteína y las redes de interacción proteína-ADN operativas en ESC. En particular, la purificación por afinidad de complejos de proteínas marcadas con biotina junto con LC-MS / MS (bio SAIP-MS) y el método bio ChIP-Chip evita la dependencia de anticuerpos de baja afinidad y permite la generación de dos recursos independientes ricos en datos. con las mismas líneas celulares marcadas con biotina y procedimientos similares (ver Figura 6), allanando el camino para estudios proteómicos a gran escala altamente eficientes en ESC.

3. Estudios proteómicos de células madre adultas

3.1. Estado actual de la proteómica de células madre adultas

Las células madre somáticas se han identificado en organismos adultos y se definen por sus propiedades duales de autorrenovación y diferenciación. Sin embargo, a diferencia de las ESC, las células madre somáticas adultas tienen una capacidad limitada para dar lugar a tipos de células dentro de un linaje definido. Durante los últimos 20 años se ha recopilado una gran cantidad de trabajo para definir mejor estas células, desarrollar estrategias de aislamiento rigurosas, deducir su in vitro y en vivo funciones y establecer perfiles transcripcionales. Si bien estos estudios han avanzado mucho en el campo, una comprensión completa de los mecanismos que regulan la autorrenovación y la potencia dentro de las células madre adultas requiere la integración de múltiples plataformas de alto rendimiento que evalúan transcriptomas, proteomas e interactomas de proteínas. Sin embargo, a diferencia de las ESC, solo un número relativamente pequeño de estudios se ha aventurado en el perfil proteómico y el mapeo de interacción de proteínas de células madre adultas. La mayoría de los estudios en el campo de la proteómica de células madre adultas se han centrado en tres tipos de células: células madre hematopoyéticas (HSC), células madre neurales (NSC) y células madre mesenquimales (MSC). Existen muchos desafíos inherentes a la realización de estudios proteómicos utilizando células madre adultas. Con la excepción de los NSC, que pueden expandirse significativamente in vitro sin pérdida de las propiedades de las células madre, la mayoría de los tipos de células madre adultas no se pueden mantener o expandir en cultivo sin inducir cambios en su potencia. Por lo tanto, existen límites para el número de células de entrada disponibles y, a diferencia del desarrollo de la amplificación global de ácidos nucleicos para el perfil transcripcional, actualmente existe una falta de un método eficaz de amplificación de proteínas.

Muchos de los esfuerzos proteómicos iniciales de in vitro Las células madre adultas expandidas han utilizado electroforesis en gel bidimensional (2-DE) como método de fraccionamiento frontal antes del análisis por espectrometría de masas (MS) (ver Figura 1A). Hay varias limitaciones inherentes a este enfoque, incluido el poder de resolución limitado, la representación deficiente de proteínas muy grandes o pequeñas, básicas o hidrofóbicas, el requisito de cantidades relativamente grandes de muestra y problemas estadísticos (diferentes algoritmos de análisis generan resultados divergentes). Los conjuntos de datos combinados de estos estudios de perfiles proteómicos revelan que el mayor grupo conservado de proteínas en las células madre adultas está involucrado en el metabolismo energético (Baharvand et al., 2007). Sin embargo, estos conjuntos de datos están sesgados en gran medida por la metodología utilizada y, en consecuencia, pueden representar simplemente las proteínas más abundantes expresadas ampliamente entre estos tipos de células.

Posteriormente a estos estudios iniciales, varios grupos han aprovechado el desarrollo de técnicas proteómicas más sofisticadas e imparciales para obtener nuevos conocimientos sobre la biología de las células madre adultas. El desarrollo de la metodología iTRAQ sensible combinada con el análisis de MS (ver Figura 1B) ha permitido la comparación de poblaciones purificadas de células madre y progenitoras hematopoyéticas con tan solo 1x106 células de entrada. Curiosamente, los resultados de este estudio sugieren que las HSC, a diferencia de sus contrapartes progenitoras más diferenciadas, están adaptadas para entornos anaeróbicos (Unwin et al., 2006). Estas diferencias no se observaron cuando se compararon los transcriptomas de estas mismas poblaciones (Unwin et al., 2006), lo que indica claramente que el perfil transcripcional por sí solo no habría sido suficiente para deducir este aspecto novedoso de la biología de las HSC. Además, iTRAQ ha sido eficaz para definir una población pobremente caracterizada de células progenitoras hematopoyéticas (Lineage - c-Kit + Sca-1 -) como principalmente de naturaleza eritroide (Spooncer et al., 2007). En el campo de las MSC, se ha utilizado la cromatografía líquida bidimensional (2D LC) o el fraccionamiento LC / LC seguido de MS / MS en tándem para demostrar que la diferenciación osteogénica de las células madre resulta del enfoque de la expresión génica en grupos funcionales en lugar de simplemente de la expresión inducida de nuevos genes (Salasznyk et al., 2005).

También se ha demostrado que las PTM pueden influir significativamente en las decisiones sobre el destino de las células madre adultas. Se ha utilizado un enfoque de fosfoproteómica cuantitativa, facilitado por la tecnología SILAC (ver Figura 1C), para estudiar la influencia de la señalización del factor de crecimiento en la diferenciación de MSC. Específicamente, se encontró que el mecanismo por el cual dos factores de crecimiento relacionados (EGF y PDGF) impactaban diferencialmente la diferenciación de MSC estaba mediado por la fosforilación de tirosina (Kratchmarova et al., 2005).

Como se destacó anteriormente en esta revisión, la caracterización reciente de un interactoma proteico funcional y una red reguladora de la transcripción en las mESC (Kim et al., 2008: Wang et al., 2006) ha producido importantes conceptos nuevos en los procesos que regulan el desarrollo y la pluripotencia de las células madre. Si bien este tipo de red intrincada aún no se ha identificado dentro de las células madre adultas, los esfuerzos iniciales hacia este objetivo han utilizado un enfoque proteómico para identificar interacciones críticas proteína-proteína que regulan la autorrenovación y la diferenciación. Utilizando la purificación de complejos de proteínas basada en anticuerpos (ver Figura 1D), un elegante estudio de Lessard et al. ha caracterizado un cambio esencial en la composición de subunidades de un complejo remodelador de cromatina similar a SWI / SNF durante la diferenciación de NSC a neuronas posmitóticas (Lessard et al., 2007). Las células madre y progenitoras neurales expresan las proteínas de subunidad BAF45a y BAF53a como parte del complejo remodelador de cromatina SWI / SNF, que son reemplazadas por BAF45b, BAF45c y BAF53b cuando los progenitores salen del ciclo celular. Es importante destacar que la naturaleza esencial de este cambio de subunidad para la diferenciación neuronal fue validada funcionalmente. En conjunto, los estudios de perfiles proteómicos e interactoma de proteínas de células madre adultas logrados hasta ahora resaltan el hecho de que estas metodologías pueden y conducirán a nuevos conocimientos sobre la biología celular subyacente que no se descubrirían por otros medios.

3.2. Direcciones futuras de la proteómica de células madre adultas

El campo de la proteómica de células madre adultas tiene un futuro prometedor. A medida que se disponga de metodologías nuevas, mejoradas y más sensibles, el número limitado de células madre adultas que se pueden obtener será una barrera menor. Un enfoque muy prometedor para una amplia variedad de aplicaciones en estudios proteómicos de células madre adultas es el uso de microarrays o chips de proteínas (ver Figura 1E). Estos tienen el potencial de identificar interacciones proteína-proteína, interacciones proteína-fosfolípido, dianas de moléculas pequeñas y sustratos de proteína quinasas, todo mientras requieren una cantidad relativamente pequeña de material de partida (Baharvand et al., 2007). El tipo de micromatrices de proteínas funcionales que se han utilizado previamente en levaduras para estudiar las interacciones proteína-proteína, demostradas específicamente para identificar proteínas de unión a calmodulina (Zhu et al., 2001), son particularmente valiosas para caracterizar el interactoma de proteínas de células madre adultas.

Uno de los principales problemas que enfrenta la proteómica de células madre adultas, es decir., la heterogeneidad celular, irónicamente se ve favorecida en gran medida por el trabajo proteómico en sí. Se ha demostrado que el aislamiento de lo que se considera una población madre / progenitora hematopoyética enriquecida (células CD34 + de sangre de cordón umbilical humano) todavía da como resultado una heterogeneidad proteómica significativa entre las muestras (Zenzmaier et al., 2005). Se expandieron las poblaciones de células madre adultas in vitro tampoco son inmunes a este problema, ya que se ha demostrado que las líneas de MSC de médula ósea humana tienen capacidades divergentes de autorenovación y diferenciación de linajes (Colter et al., 2001). La forma en que la proteómica podrá abordar estos problemas es mediante la caracterización adicional de los antígenos de la superficie celular expresados ​​específicamente en varios tipos de células madre adultas, lo que permitirá una capacidad de aislamiento prospectivo aún mayor y, por lo tanto, poblaciones de células más homogéneas. Esto se ha reconocido en el campo de las HSC, donde el perfil del transcriptoma permitió la identificación de la familia SLAM de marcadores de superficie celular (Kiel et al., 2005), que han mejorado los medios de aislamiento de las HSC. Si los datos del transcriptoma pueden lograr un éxito moderado con este fin, existe un gran potencial para identificar nuevos biomarcadores a través de la proteómica de membrana. Además, el uso de indicadores fluorescentes específicos de linaje permitirá el aislamiento de poblaciones celulares más homogéneas. Esta estrategia se ha empleado con éxito en estudios proteómicos que examinan la diferenciación de las mESC en linajes mesodérmicos / hemangioblastos con el posterior perfil utilizando iTRAQ (Williamson et al., 2007).

4. Observaciones finales

Los estudios proteómicos de células madre embrionarias, así como adultas, complementarán la caracterización de estas células a nivel transcripcional (transcriptoma) y conectarán la transcripción genética y los fenotipos celulares. El verdadero desafío ahora es integrar la proteómica en el espectro completo de la investigación biológica y biomédica. Durante la próxima década, caracterizar el proteoma y el interactoma de las células madre a través de la identificación de los componentes de las proteínas, la cuantificación de la concentración de proteínas, la disección de las redes de interacción de proteínas y el descifrado de los circuitos transcripcionales proporcionará una gran cantidad de información valiosa. Estos datos permitirán un análisis y modelado a nivel de sistemas integrados de los mecanismos que regulan la autorrenovación y la potencia de las células madre.Los avances combinados en la biología de las células madre y la EM son muy prometedores para la disección de componentes o vías que estimulan la proliferación y la autorrenovación o inducen la diferenciación hacia células o tejidos específicos. En última instancia, esto proporcionará un marco para comprender la biología subyacente de las células madre y permitirá la manipulación precisa y la realización de todos los beneficios terapéuticos clínicos de estas células únicas.


Discusión

Los percebes de bellota producen cantidades limitadas de adhesivo insoluble en agua en una ubicación obstruida, lo que hace que este material sea notoriamente difícil de analizar. El cuerpo del percebe está confinado dentro de placas parietales calcificadas (capa lateral) y operculares que oscurecen la interfaz en los percebes de bellota, donde la expansión radial de la interfaz adhesiva tiene lugar de una manera correlacionada con su ciclo de muda [50, 51]. Además, esta región interfacial tiene en sí misma solo unas pocas micras de espesor y, en algunas especies, se encuentra debajo de una placa base calcificada. Si bien el adhesivo en sí está compuesto principalmente de proteínas [52], también se ha observado la presencia de carbohidratos y lípidos en esta región crítica [14, 53-55]. Recientemente han salido a la luz nuevos detalles relacionados con la formación y composición del adhesivo de percebes basados ​​en microscopía confocal de percebes vivos [8, 14, 55] y enfoques novedosos para romper la interfaz adhesiva [6].

Observación directa de la interfaz adhesiva en expansión en percebes de bellota adultos vivos (específicamente A. anfitrito) ha revelado un proceso espacio-temporal complejo [8, 14, 26, 55]. El desarrollo y la deposición de lípidos, proteínas y carbohidratos ocurren en varios puntos de tiempo a lo largo del ciclo de muda. Una capa epidérmica, ubicada en el borde radial de ataque (y decenas de micrones eliminados de la interfaz) y que se extiende hacia el centro del percebe, tiene un papel fundamental en proporcionar los componentes básicos para la interfaz de múltiples capas [14], incluida la proteína entrega. Además, el suministro de lípidos y especies reactivas de oxígeno al borde de ataque contribuye a la limpieza de la superficie, un importante paso de preparación para la adhesión [14]. Tradicionalmente, a una red capilar bien descrita con conductos distribuidos que terminan cerca del borde de ataque se le ha asignado la función de proporcionar directamente cemento [25, 26] o fluido de muda [26] a la interfaz del borde de ataque. Carga et al. (2012) mostraron que el proceso de muda, incluido el desarrollo de las redes capilares y la mineralización, coincidió con una mayor adhesión, pero también mostró más tarde que una capa de proteína está presente y se entrega a la interfaz antes de que se complete la red capilar [55]. Los experimentos de Saroyan et al. sugirió que el papel de la red capilar está relacionado con la esclerotización [25], aunque falta evidencia biofísica directa que confirme la composición de las químicas en la red capilar para los percebes de bellota. Si bien el proceso de formación del adhesivo de percebe de bellota no se comprende completamente, es fundamental comprender el composición del adhesivo en sí y hacerlo de manera eficiente con una cantidad mínima de material de partida, un objetivo principal de la investigación actual.

Se han realizado avances recientes en la disolución del adhesivo con HFIP y han dado como resultado la identificación de proteínas nuevas [6, 17], pero los métodos mejorados permitirán procesar muestras de organismos individuales y permitir las investigaciones del adhesivo de percebe en relación con las condiciones biofísicas o ambientales. En este trabajo, se desarrollaron métodos PCT para procesar el adhesivo espeso hidratado que a menudo producen los percebes cuando se cultivan en sustratos de silicona [36]. La alta presión ayudó en la solubilización de la proteína de la interfaz de percebe, lo que condujo a la identificación y caracterización de proteínas adicionales en la interfaz. El método PCT ofrece mejoras metodológicas sustanciales al someter el adhesivo a altos niveles de presión en presencia de un solvente concentrado, siendo el más efectivo la urea, que condujo a la identificación más confiable (es decir, consistente en múltiples réplicas) del mayor número de proteínas. . Se ha demostrado que la presión elevada aumenta la eficiencia de la proteólisis y disminuye el tiempo de digestión en comparación con las condiciones de presión ambiental, lo que significa que los métodos PCT se pueden completar en menos de 8 horas, una reducción masiva en la cantidad de tiempo necesario para preparar el adhesivo de percebe usando métodos en gel para proteómica (típicamente que dura al menos 2-3 días [57]). También hay un aumento en el rendimiento, ya que se pueden procesar 16 muestras simultáneamente y con una cantidad significativamente menor de material de partida (

1-2 mg de adhesivo) para análisis. Además de reducir el volumen y el tiempo de la carga de trabajo durante el procesamiento, el método PCT condujo a la identificación de la mayoría de las proteínas ya conocidas para formar el adhesivo y al descubrimiento de nuevas proteínas en la interfaz.

Alrededor del 80% de la A. anfitrito proteínas adhesivas previamente identificadas con HFIP y métodos basados ​​en gel [6] también se encontraron en este estudio utilizando PCT. La mayoría de las proteínas se identificaron con un alto número de péptidos mínimos (5), aunque

El 30% se identificó solo cuando el umbral se redujo por debajo de 4 péptidos mínimos. Las proteínas que se encuentran en la interfaz se pueden dividir en tres grupos funcionales principales predichos: proteínas estructurales a granel, enzimas y feromonas. Veintiséis de las proteínas identificadas previamente que se predijo que eran proteínas a granel se agruparon en 6 subgrupos (proteínas similares a 19, 43, 52, 57, 100 y 105). De estos, la mayoría (23) se identificaron mediante PCT. Esas proteínas no identificadas fueron una instancia única de proteínas similares a AaCP19 (AaCP19-9) y 2 instancias de proteínas similares a AaCP43 (AaCP43-5 y -6). AaCP19-9 y AaCP43-5 solo se identificaron a partir de la transcriptómica y no se han identificado en el adhesivo mediante proteómica. Usando el algoritmo de agrupamiento en Scaffold, AaCP19-7 y -8 se agruparon juntos, lo que destaca la secuencia similar entre las dos proteínas. De las diecisiete enzimas que se han identificado en la interfaz de superficie [6, 17, 27], peroxinectina- (AaPxt), lisil oxidasa- (AaLOx), inhibidor de serina proteasa- (AaPI), peroxidasa- (AaPx) y peptidasa- (AaPep) se identificaron proteínas similares en el presente estudio, pero no las proteínas de ácido de suero (AaWAP). También se han encontrado tres variaciones de MULTIFUNCin (AaMulti), una feromona de agregación de asentamiento [16], en el adhesivo [6, 17], y dos de ellas (AaMulti-1 y -2) se identificaron aquí.

Las condiciones del disolvente examinadas junto con PCT demostraron tener un gran efecto en la identificación de proteínas. El metanol y el HFIP son ambos disolventes orgánicos, mientras que la urea es un agente caotrópico. Los disolventes orgánicos y los caótropos ayudan a la solubilización de las proteínas de distintas formas: los disolventes orgánicos estabilizan las regiones hidrófobas que interactúan en condiciones acuosas, mientras que los caótropos interrumpen las interacciones de las proteínas y estabilizan la proteína no plegada resultante mediante enlaces de hidrógeno e interacciones electrostáticas [58]. La solubilización del cemento vía PCT en urea 8 M resultó en el mayor número de espectros por muestra, lo que indica que este tratamiento proporcionó el mayor grado de solubilización adhesiva y, posteriormente, la mayor identificación tanto de espectros como de proteínas (74). La condición de metanol al 60% tenía el segundo grupo más grande de proteínas identificadas (46) con solo 3 proteínas únicas identificadas en comparación con la condición de urea 8 M. En general, estas dos condiciones tenían perfiles de aminoácidos, péptidos y proteínas relativamente similares. De las 22 proteínas identificadas en la condición 100% HFIP, solo dos eran exclusivas de esta condición. El HFIP también dio como resultado diferencias en el tipo de aminoácidos, así como en los perfiles de peso molecular de péptidos y proteínas observados, lo que indica que la proteólisis se vio afectada. En particular, el peso molecular promedio del péptido fue significativamente mayor usando HFIP al 100% en comparación con MeOH al 60% o urea 8 M, sin embargo, el peso molecular promedio de la proteína fue mucho menor. Entre todas las condiciones examinadas, estos datos indican que la urea 8 M fue la técnica óptima de solubilización del cemento con PCT, mientras que el HFIP diluido fue el peor y la adición de HFIP a urea o metanol fue perjudicial para la identificación de proteínas. Aunque la condición de 100% HFIP resultó en la menor cantidad de identificaciones de péptidos / proteínas, esta condición resultó en una alta solubilización de proteínas similares a AaCP19 y AaCP43, que son difíciles de solubilizar y se cree que son parte integral de la función adhesiva de percebe [6]. Las diferencias en la identificación de proteínas de los extractos de HFIP en este trabajo con PCT con respecto a métodos anteriores basados ​​en gel [6] pueden atribuirse a la disminución de la función de la proteasa y a los tipos de muestras analizadas. Aquí, solo se examinó el adhesivo espesado, mientras que anteriormente se sometieron a HFIP múltiples tipos de muestras (adhesivo espesado, adhesivo depositado en perlas de vidrio y "placas", compuestas por la cutícula basal y la capa subyacente de cemento duro). Desde la perspectiva de construir un perfil de proteína más completo de adhesivo de percebe, PCT con urea 8 M proporciona la mayor cantidad de información, aunque también está claro que diferentes disolventes son capaces de solubilizar diferentes proteínas y grupos de proteínas. Estos resultados sugieren que el adhesivo contiene proteínas que abarcan una amplia gama de propiedades físicas y químicas. Como tal, un protocolo de preparación de muestras de "talla única" puede no producir un perfil representativo del adhesivo, lo que podría explicar por qué las identificaciones presentadas en este documento son las "más profundas" hasta la fecha.

La aplicación de PCT al adhesivo de percebe permitió la identificación de varias proteínas nuevas en el A. anfitrito interfaz. Solo una de estas nuevas proteínas se identificó en la condición de 100% HFIP (AaCP105-5), un resultado nada sorprendente ya que se ha utilizado HFIP para disolver y caracterizar A. anfitrito proteínas adhesivas previamente. La mayoría de las nuevas proteínas se identificaron utilizando urea como disolvente, aunque dos (AaHem y AaSP-4) se identificaron solo en la condición de metanol.

Para caracterizar estas nuevas proteínas, se identificaron secuencias o dominios homólogos a los datos disponibles públicamente. La caracterización de las proteínas adhesivas de percebe a menudo se ha basado en la identificación de aminoácidos enriquecidos para inferir la función [6, 23], sin embargo, el crecimiento de los datos disponibles públicamente ha hecho posible un análisis basado en la similitud de secuencias aquí. De las 81 proteínas identificadas en este estudio, 8 quedaron sin ninguna función o identidad putativa asignada. Estas proteínas no comparten ninguna similitud de secuencia con ninguna proteína conocida ni con ninguna de las otras proteínas de interfaz. La similitud de secuencia y el análisis previo [6, 17] nos llevaron a dividir las 73 proteínas de interfaz restantes en tres categorías funcionales putativas: proteínas estructurales, enzimas o feromonas. Una proteína, AaCP43-7, se agregó a la familia de proteínas estructurales similares a AaCP43 porque tenía una homología significativa con la secuencia parcial de AaCP43-2, que nuestro grupo de investigación había depositado previamente en NCBI (GenBank: AQA26374.1). También se agregaron cinco proteínas al grupo de proteínas estructurales porque tenían similitud de secuencia con las familias similares a AaCP105 (AaCP105-3 a -5) y similares a AaMuc (AaMuc-1 y -2). Se identificó una nueva familia de proteínas, AaCP34, donde los 5 miembros tenían secuencias similares entre sí. Las proteínas similares a AaCP34 no tenían secuencias o dominios homólogos a otras proteínas conocidas.

Se agregaron otras 7 proteínas a la categoría de proteínas estructurales porque sus supuestas identidades indican que podrían cumplir algún tipo de función adhesiva. Dos proteínas (AaTitin) mostraron una homología de débil a moderada con una proteína de Titina predicha (Número de Acceso NCBI: XP_015810555.1). La titina es una proteína gigante que confiere elasticidad a las fibras musculares [59]. Las proteínas AaTitin no tienen dominios conservados y son proteínas pequeñas (MW previsto = 33 y 20 kDa). Su similitud de secuencia con una proteína similar a la titina predicha (XP_015810555.1) parece surgir de residuos de valina repetitivos. Otro grupo de tres proteínas (AaGlut) muestra una homología parcial con una proteína anotada como una glutenina predicha de Plutella xylostella, la polilla del lomo de diamante (XP_011568564.1), a pesar de que la glutenina es una proteína vegetal que confiere elasticidad a la masa de trigo [60]. Las proteínas similares a AaGlut no contienen homología con ningún dominio conservado, pero la P. xylostella La proteína similar a la glutenina tiene un supuesto dominio de superfamilia Glutenin_hmw, lo que sugiere que puede haber ocurrido una evolución convergente [61] para impartir a esta proteína propiedades elastoméricas. Otra proteína (AaFas) contiene dos dominios repetidos de fasciclina pronosticados y tiene homología con múltiples proteínas de tipo ig-h3 inducidas por el factor de crecimiento transformante β, que a menudo contienen cuatro dominios repetidos de fasciclina [62]. Las proteínas de tipo Ig-h3 son similares al colágeno y pueden secretarse en tejidos ricos en fibra, y sus dominios de facsiclina pueden funcionar en la unión de integrinas [63]. Se ha demostrado que las proteínas de tipo AaCP19 y AaCP43 tienen dominios repetitivos complejos y simples y homología con las proteínas de seda, lo que indica que las nanofibrillas formadas por estas proteínas pueden ser importantes para la adhesión del percebe [6, 64].

Cuatro de las proteínas de interfaz tienen homología y comparten dominios con proteínas implicadas en la inmunidad de invertebrados (AaHem: hemocitina AaVit-1 y -2: vitelogenina AaβGBPP: precursor de la proteína de unión a β-1,3-glucano). La hemocitina funciona como una lectina invertebrada que se une a los carbohidratos y promueve la hemaglutinación en respuesta a patógenos o estructuras extrañas [65, 66]. La vitelogenina es una proteína multifuncional que, además de su función principal de proporcionar nutrientes a los embriones en desarrollo, se une a los carbohidratos y promueve la coagulación a través de un dominio del factor von Willebrand conservado (EvW) [67, 68]. Las vitelogeninas de percebe contienen EvW y muchos de los otros dominios conservados [38] que se encuentran en todas las secuencias de vitelogenina [69]. La proteína de unión al β-1,3-glucano inicia la respuesta inmunitaria de los crustáceos después de unirse al β-1,3-glucano [70-72], un carbohidrato que se encuentra en las paredes celulares de hongos y algas. Se propuso anteriormente que los procesos de agregación y reticulación de proteínas que tienen lugar durante las respuestas inmunológicas se hayan reutilizado evolutivamente en la polimerización adhesiva de percebes [27]. La capacidad de estas proteínas para unirse a los carbohidratos también es de interés ya que el adhesivo proteináceo está en contacto directo con una capa de cutícula rica en carbohidratos y quitina [55], sin embargo, no se han encontrado proteínas de unión a quitina mediante espectrometría de masas en la superficie. . Se identificaron cuatro transcripciones que contienen términos GO de unión a quitina a partir de la región prosoma de T. japonica formosana [22], pero no se ha examinado si esas proteínas se encuentran en la región adhesiva. Aquí, se encontró que AaCP105-1 y -3 y AaHem contienen dominios de unión a quitina putativos (ChtBD2, de la superfamilia CBM_14). Por lo tanto, estas proteínas relacionadas con el sistema inmunitario, junto con las proteínas de la familia AaCP105, pueden funcionar en la interfaz uniéndose a la capa de la cutícula y promoviendo la agregación de proteínas.

Más de una cuarta parte de las proteínas identificadas tienen homología que sugiere una función enzimática potencial. Estas enzimas incluyen peroxinectinas, lisil oxidasas, peroxidasas, una peptidasa y serina proteasas e inhibidores. La presencia de estas enzimas en la interfaz se ha observado previamente, al igual que la actividad de las peroxidasas y lisil oxidasas [6, 17, 25, 28]. La oxidación ocurre durante la esclerotización cuticular en artrópodos [73, 74], y puede ocurrir durante el curado con adhesivo de percebe por oxidación de AaCP43-1 [17]. También se identificaron ocho serina proteasas potenciales y seis inhibidores de proteasas. Las serina proteasas e inhibidores regulan la cascada de fenoloxidasa que controla la inmunidad de los invertebrados mediante la activación de proteasas de las protirosinasas involucradas en la melanización [72, sin embargo, las tirosinasas no han sido identificadas en este trabajo ni en análisis proteómicos previos del material interfacial [6, 17]. Las proteasas también participan en la degradación de la cutícula durante la muda en insectos y crustáceos [75-78], ya sea por digestión directa de la matriz proteica cuticular o activando otras enzimas necesarias. Los percebes de bellota forman una nueva capa de cutícula doblada en la base que se estira a medida que ocurre el crecimiento radial. Cuando la cutícula no puede estirarse más, se produce la muda y la cutícula vieja se desgarra para dejar espacio para la expansión de una nueva capa de cutícula doblada [14, 55, 79, 80]. Las proteasas y los inhibidores de proteasa que se encuentran en la superficie de la interfaz pueden, por tanto, desempeñar un papel doble en la muda y la adhesión, como se ha sugerido anteriormente [27].

Las feromonas también se identificaron en las proteínas en la superficie de la interfaz, como se informó anteriormente [6, 17]. Las glicoproteínas MULTIFUNCin se localizan en el percebe mismo y son señales de comunicación química intra e interespecies, que atraen tanto a las larvas de percebes que se asientan como a los depredadores [16]. AaMulti-5 tenía homología con α2-macroglobulinas y contenían múltiples dominios inhibidor de proteinasa (A2M e ISOPREN_C2) y receptor (A2M_recep), características compartidas con todas las demás proteínas AaMulti, así como el complejo proteico inductor de asentamiento (SIPC). α2-Las proteínas de macroglobulina son activas en el sistema inmunológico innato [81], lo que lleva a Ferrier et al. (2016) para plantear la hipótesis de que la función de comunicación de las proteínas ortólogas MULTIFUNCin y SIPC surgió de una función inmune ancestral.

Tres de las proteínas identificadas tenían homología con una secuencia depositada identificada como feromona de asentamiento en el agua (WSP GenBank: BAM34601.1), esto probablemente sea lo mismo

Proteína de 30 kDa descrita por Endo et al. [82], que, a diferencia de MULTIFUNCin y SIPC, se libera en la columna de agua [83]. Los péptidos de SIPC escindidos proteolíticamente también se liberan en la columna de agua [84], pero la secuencia de aminoácidos de las proteínas WSP es distinta de la α2-feromonas de tipo macroglobulina, lo que indica que WSP y SIPC son distintas. El único dominio encontrado en WSP es Cupin_5 (cl01418), aunque el nivel de homología es bajo (valor E & lt 1.e-5). El dominio de cupina que contiene proteínas tiene una amplia gama de funciones y se encuentran en procariotas y eucariotas [85], lo que dificulta la predicción de la función de la proteína basada en la presencia de este dominio.

Es importante tener en cuenta que el transcriptoma generado a partir del tejido del submanto [21] se utilizó para construir una base de datos de proteínas para A. anfitrito y ha hecho posible la proteómica no dirigida [6, 17, 38], sin embargo, el progreso está limitado por la falta de información genómica. Muchos de los péptidos detectados por el espectrómetro de masas se asignan de manera ambigua a múltiples proteínas con secuencias predichas similares, lo que da como resultado muchos grupos de proteínas. Asimismo, muchas de estas proteínas con secuencias similares presentan una alta homología al comparar sus secuencias con BLAST. En ausencia de una secuencia completa del genoma, se desconoce si estas proteínas son isoformas o son producidas por genes únicos. La base de datos de proteínas también es limitada porque se creó a partir de transcripciones en un solo tejido y no contiene toda la información genética de A. anfitrito. Los esfuerzos futuros para producir un genoma ayudarían en todos los análisis proteómicos de A. anfitrito.


Las herramientas de la proteómica

Norm Dovichi y Amanda Hummon | 16/04/2013

Así como las proteínas son el tercer componente en el flujo de información genética después del ADN y el ARN, la proteómica representa temporalmente el tercer desafío en el análisis integral de los sistemas vivos, después de la genómica y la transcriptómica. También es el más complejo de estos desafíos. Las proteínas son mucho más diversas y difíciles de cuantificar que los ácidos nucleicos y, a diferencia del ADN, su expresión varía tanto en el tiempo como en el espacio.

El conocimiento de la secuencia y abundancia de proteínas tiene muchas funciones importantes en la biotecnología y la medicina. Una aplicación importante es el descubrimiento de biomarcadores, para lo cual la disponibilidad de muestras de pacientes es un recurso esencial. La hipótesis detrás de los estudios de biomarcadores es que una enfermedad, como el cáncer, deja marcadores reveladores en el suero que pueden utilizarse para el diagnóstico y el pronóstico. Quizás el marcador más conocido, el antígeno prostático específico (PSA), ilustra la complejidad del campo. El PSA se desarrolló como indicador de pronóstico para pacientes después del tratamiento por cáncer de próstata. Su posterior uso generalizado como prueba de detección para la población general no se validó adecuadamente y ahora se desaconseja ampliamente.

La proteómica también se usa para identificar redes celulares que están desreguladas en caso de enfermedad. Dichos estudios comparan tejido primario de individuos enfermos y sanos, y el objetivo es identificar posibles dianas terapéuticas.

Otra aplicación es el control de calidad de terapias recombinantes. Estos fármacos a base de proteínas se producen en cultivos celulares. La célula huésped, que a menudo es la línea celular de ovario de hámster chino (CHO), está diseñada para producir la terapéutica deseada. A continuación, las células o el cultivo celular se recogen, se lisan y se someten a una serie de pasos de purificación por afinidad. Sin embargo, quedan proteínas residuales de la línea de células huésped, aunque a niveles traza. Las proteínas de la célula huésped representan alérgenos potenciales y es vital tanto identificar los contaminantes como determinar su abundancia.

Una clase de agentes terapéuticos recombinantes son los anticuerpos, que se generan a partir de anticuerpos policlonales contra la molécula diana. Los anticuerpos representan la excepción a la regla de que la secuencia genómica informa la secuencia de proteínas dentro de un organismo. El complejo sistema inmunológico baraja la secuencia de anticuerpos, de modo que cada célula inmunológica contiene una secuencia genética única para los anticuerpos que produce. Como resultado, es necesario realizar una determinación de la secuencia de proteínas de novo para los anticuerpos diana.

Finalmente, las modificaciones postraduccionales decoran proteínas con una amplia gama de grupos funcionales. Estos grupos funcionales juegan un papel diverso en la modulación de la función de una proteína. La fosforilación es la modificación postraduccional más comúnmente estudiada debido a la disponibilidad de herramientas sólidas, el papel bien entendido que desempeña la fosforilación en la modulación de la función de la proteína y la naturaleza simple de la modificación. No es raro ver estudios en los que se estudia el estado de fosforilación de una gran fracción del proteoma. Por el contrario, otra importante modificación postraduccional, a saber, la glicosilación, ha recibido mucha menos atención. Esta falta de atención no refleja una falta de importancia, sino la complejidad de la modificación y el estado primitivo de las herramientas analíticas.

Perspectiva historica

Aunque se considera el hermano menor de la genómica, el análisis de la secuencia de proteínas es, de hecho, más antiguo que la secuenciación del ADN. Se origina a finales de la década de 1940 y principios de la de 1950 con la determinación de la secuencia de insulina de Sanger y el desarrollo de Edman de la reacción de degradación del isotiocianato. Estas tecnologías son laboriosas, lentas y requieren grandes cantidades de material de partida. Era bastante raro determinar la secuencia completa de una proteína mediante el uso de la química de Edman. En cambio, esa tecnología primitiva se utilizó para generar la secuencia de un pequeño péptido creado a partir de la proteína, que quizás consta de una docena de aminoácidos. Luego, el código genético se utilizó para crear sondas para el gen correspondiente. Las bibliotecas creadas a partir de fragmentos del genoma se seleccionarían para el gen diana, que luego se secuenciaría.

Como describimos en el número inaugural de The Analytical Scientist, la genómica experimentó un crecimiento y una maduración explosivos durante los últimos veinte años. Un legado de esto es la secuencia completa del genoma de un gran número de organismos. Esa información genética, a su vez, se ha utilizado para poblar bases de datos con secuencias de proteínas esperadas para esos organismos. Ya no es necesario sintetizar sondas de oligonucleótidos correspondientes a la secuencia de un péptido y luego rastrear una biblioteca de fragmentos genéticos para identificar el gen de interés. En cambio, la secuencia de péptidos se criba in silico frente a la secuencia genética. La disponibilidad de genomas completos ha sido un recurso extraordinariamente valioso en los estudios proteómicos.

Para maximizar el potencial de conectar secuencias genéticas y de proteínas, se necesitaban métodos eficientes para generar secuencias a partir de péptidos cortos y en la década de 1970 se identificó la espectrometría de masas como la herramienta ideal. El principal desafío consistía en introducir proteínas o péptidos grandes y bastante no volátiles en la fase gaseosa para su ionización y análisis. Se investigaron varios enfoques, incluida la nebulización ultrasónica y la espectrometría de masas de ionización secundaria. Estos fueron reemplazados por el desarrollo de la ionización por electropulverización por Fenn y MALDI (desorción / ionización láser asistida por matriz) por Tanaka y Hillenkamp en 1988. Juntos, estos enfoques abrieron el uso de la espectrometría de masas para estudios proteómicos de alto rendimiento.

Se requirieron tres avances adicionales para estudios proteómicos generalizados. En primer lugar, como señalamos en nuestro artículo de la edición de enero de The Analytical Scientist, las bases de datos de secuencias genómicas se acercaron a un tamaño razonable en la década de 1990. Desde entonces, los estudios de secuenciación del genoma completo de muchos organismos han poblado bases de datos con todo el elenco de secuencias de proteínas.

En segundo lugar, comenzando con el esfuerzo pionero de Yates y sus colegas alrededor del año 2000, el desarrollo de motores de búsqueda de bases de datos eficientes automatizó la identificación de esas secuencias de proteínas. En este punto, sabíamos lo que estábamos buscando.

Y tercero, comenzando con la química iTRAQ (etiquetas isobáricas para cuantificación relativa y absoluta) de Aebersold y sus colegas en 2000, se desarrolló un conjunto de reactivos y herramientas para realizar proteómica cuantitativa, lo que nos permite comprender los cambios en la abundancia de proteínas que acompañan a la enfermedad y el desarrollo. .

Los estudios proteómicos se dividen comúnmente en de arriba hacia abajo y de abajo hacia arriba (ver Figura 1). La proteómica descendente ioniza e introduce proteínas intactas en un espectrómetro de masas de alta resolución. Este enfoque tiene la ventaja de capturar todas las modificaciones postraduccionales dentro de la proteína, pero adolece de la desventaja de necesitar ionizar, fragmentar e interpretar los datos resultantes para una molécula muy grande.

Fig 1: Diagrama esquemático de proteómica

La gran mayoría de la proteómica se basa en el protocolo ascendente, en el que la compleja mezcla de proteínas de una célula, tejido u organismo se digiere enzimáticamente en una gran mezcla de péptidos. La tripsina es la enzima proteolítica de elección. Esta enzima está disponible con alta pureza y es relativamente barata. Corta proteínas en residuos de lisina y arginina. Dado que estos aminoácidos son relativamente comunes, cada proteína se corta en muchos péptidos, que normalmente tienen de cinco a 30 residuos de longitud. Si bien este rango de masas sufre una interferencia significativa de la matriz utilizada en MALDI, es muy adecuado para el análisis por ionización por electropulverización, que se utiliza con más frecuencia. La determinación de la mayor parte de la secuencia de péptidos, junto con el conocimiento de la masa del ión original, reduce la identificación a un pequeño número de posibilidades en las búsquedas de bases de datos.

Los primeros estudios proteómicos se centraron en identificar proteínas dentro de una muestra determinada, proporcionando esencialmente una lista de partes de las proteínas presentes. Se puede obtener un mínimo de información cuantitativa a partir de dicha lista de partes, más comúnmente simplemente contando el número de ocurrencias de péptidos de una proteína diana. Más recientemente, se ha utilizado el marcaje isotópico diferencial para determinar cambios en la abundancia de proteínas entre dos o más muestras. Por ejemplo, las abundancias de proteínas de tejidos normales y enfermos se pueden comparar para identificar rutas enzimáticas y de señalización asociadas con la enfermedad.

Los estudios proteómicos ascendentes modernos constan de cuatro etapas. Primero, las muestras de proteína se digieren y se marcan isotópicamente. En segundo lugar, la mezcla de péptidos complejos resultante se somete a una o más rondas de separación. En tercer lugar, la muestra se ioniza y analiza mediante el espectrómetro de masas. Cuarto, los datos resultantes se analizan e interpretan. A continuación, consideramos los avances recientes en cada una de estas cuatro áreas.

Preparación de la muestra

La digestión con tripsina se realiza entre 30 minutos y 24 horas. Es una compensación: los períodos de digestión en el extremo más corto reducen el tiempo de análisis y minimizan la autodigestión, pero a expensas de una digestión incompleta, lo que resulta en escisiones perdidas, mientras que un tiempo de digestión más largo conduce a una digestión más completa pero a expensas de más autodigestión y mayor tiempo de análisis general. La tripsina puede inmovilizarse sobre un soporte sólido, lo que aumenta drásticamente la concentración de enzima utilizada en la reacción y minimiza la autodigestión de la enzima (consulte la Figura 2). La tripsina inmovilizada proporciona una mejora de aproximadamente un orden de magnitud en el rendimiento de la muestra, lo que es valioso, por ejemplo, en el control de la producción de proteínas terapéuticas recombinantes. Acelerar la digestión es particularmente importante en la industria biofarmacéutica, donde el análisis proteómico rápido es vital para el control de calidad de las proteínas terapéuticas producidas en cultivos celulares. El objetivo es proporcionar información con la suficiente rapidez para que se utilice para el control de procesos.

Fig 2: Procedimiento de tripsina inmovilizada. Las proteínas se desnaturalizan, reducen y alquilan según corresponda antes de la digestión. La solución de digestión de proteínas, que contiene la proteína a digerir, se prepara y se añade a la resina de tripsina inmovilizada. La solución de digestión de proteínas se incuba con la resina durante 30 minutos. Los péptidos digeridos se eliminan por centrifugación y luego se preparan para el análisis posterior.

Separaciones

La mezcla de péptidos presente en la digestión tríptica de un proteoma complejo es demasiado compleja para el análisis directo por espectrometría de masas. En cambio, la mezcla debe separarse para simplificar la muestra rociada en el espectrómetro de masas. En la inmensa mayoría de los casos, esta separación se logra mediante cromatografía líquida de fase inversa de elución en gradiente. Este modo de separación emplea sistemas de disolventes que son compatibles con la ionización por electropulverización y que proporcionan una resolución de separación sobresaliente.

La resolución de las separaciones cromatográficas mejora drásticamente a medida que disminuye el tamaño de las partículas de la fase estacionaria. Sin embargo, la presión requerida para la separación también aumenta a medida que disminuye el tamaño de las partículas. El desarrollo de tecnología para la cromatografía líquida de ultra alta presión de rutina ha dado como resultado mejoras notables en la separación de péptidos proteolíticos para análisis espectrométrico de masas.

Prácticamente todos los análisis proteómicos automatizados emplean cromatografía líquida para separar los péptidos antes del análisis. Sin embargo, hay indicios de que la electroforesis capilar puede resultar valiosa en el análisis proteómico. Hemos desarrollado una nueva interfaz de electropulverización, que utiliza un extenso fraccionamiento previo de la muestra en combinación con separaciones electroforéticas capilares rápidas combinadas con espectrómetros de masas de alta velocidad y alta resolución, lo que proporciona una alternativa interesante. En la mayor comparación publicada de electroforesis capilar con separación UPLC, las dos técnicas lograron un número esencialmente idéntico de identificaciones de proteínas en un tiempo de análisis idéntico. En este análisis, que fue el estudio de un secretoma bacteriano, las dos técnicas tenían aproximadamente un cincuenta por ciento de superposición en las proteínas que identificaron, lo que sugiere que sondean porciones complementarias del proteoma. Además, este estudio también demuestra que ninguna técnica es capaz de resolver todos los componentes dentro de un proteoma complejo, y que muchas situaciones se beneficiarán de la combinación de dos o más técnicas.

Analizadores de masas

Fig 3: El Orbitrap consta de un electrodo externo, en forma de barril, y un electrodo coaxial interno, en forma de huso, que forman un campo electrostático con distribución de potencial cuadrilogarítmica. La corriente de la imagen de los iones atrapados dinámicamente se detecta, digitaliza y convierte utilizando la transformada de Fourier en frecuencia y luego en espectros de masas. Para ver un video de un Orbitrap en acción, vaya a: planetorbitrap.com. Imagen cortesía de thermoscientific.com.

El desarrollo de analizadores de masas de alta velocidad y alta resolución ha revolucionado la investigación proteómica. Una clase de instrumentos, el Orbitrap, es bastante sorprendente en su desempeño (Figura 3). Estos instrumentos alcanzan habitualmente una resolución de masa de 100.000 (a m / z = 400), producen espectros en tándem a 10 Hz y alcanzan límites de detección de attomoles bajos para los iones originales.

Esta área de investigación es muy competitiva y cada tres o cinco años aparecen nuevas generaciones de espectrómetros de masas. Sin duda, veremos avances continuos en el análisis de masas durante muchas décadas.

Proteómica cuantitativa

Los primeros estudios proteómicos profundizaron en el proteoma, con el objetivo de detectar una gran fracción del proteoma predicho a partir de la traducción de marcos de lectura abiertos en el genoma. Sin embargo, estas listas de piezas tienen un valor limitado, ya que no proporcionan directamente información sobre el cambio en la abundancia de proteínas entre muestras, como las de tejido sano y enfermo.

Se han desarrollado varias estrategias para la proteómica cuantitativa, y muchas más están en desarrollo. La mayoría de los métodos emplean marcaje isotópico de aminas primarias que se encuentran en residuos de lisina o en el extremo N de péptidos, o azufres en residuos de cisteína reducidos, usando reactivos específicos. Dos o más muestras se tratan con diferentes marcadores isotópicos, las muestras se agrupan y analizan utilizando técnicas cromatográficas y espectrométricas de masas convencionales. Se utiliza software para identificar la firma isotópica de los espectros de masas. Los reactivos pueden ser tan simples como el formaldehído, que introduce una firma isotópica, en la química iTRAQ que emplea reactivos que revelan la firma isotópica solo después de la fragmentación durante la espectrometría de masas en tándem.

Alternativamente, se pueden emplear métodos sin marcaje para cuantificar la abundancia de proteínas. Estos incluyen el recuento espectral, donde el número de péptidos identificados para una proteína proporciona una estimación sorprendentemente simple para una cuantificación aproximada. La monitorización de reacciones múltiples (MRM), también conocida como monitorización de reacciones seleccionadas (SRM), proporciona una precisión mucho mayor (consulte la Figura 4). Este enfoque emplea un triple cuadrupolo o un instrumento Q-trap. El dispositivo está programado para aislar un padre específico con el primer cuadrupolo, para fragmentar ese ion en una celda de baja presión y luego monitorear la intensidad de un fragmento de ion específico. MRM / SRM proporciona hasta cuatro órdenes de magnitud de rango dinámico lineal y límites de detección subatomoles. Solo es útil cuando se ha identificado el péptido diana y cuando esa información está disponible para la construcción de una curva de calibración.

Fig 4: Monitoreo de reacciones múltiples (MRM). Basado en N. R. Kitteringham et al. , J. Chromatogr. B, 877, 1229 - 1239 (2009).

Modificaciones postraduccionales

Como se mencionó anteriormente, la mayoría de las proteínas tienen grupos funcionales agregados después de la traducción. Estas modificaciones juegan un papel vital en la determinación de la función de la proteína, la ubicación celular y la vida útil. Se han descrito trescientos tipos diferentes de modificaciones postraduccionales, de las cuales solo unas pocas se han estudiado en detalle a nivel de proteomas.

El análisis de fosforilación ha recibido la mayor atención, en parte debido a la importancia de la fosforilación en la función de las proteínas, pero también debido a la relativa simplicidad del desafío analítico. La mayoría de los análisis fosfoproteómicos emplean reactivos de afinidad, como iones metálicos mantenidos en una fase estacionaria (la técnica se conoce como cromatografía de afinidad mediada por iones, o IMAC), para enriquecer selectivamente péptidos fosforilados de digestiones trípticas. Los péptidos capturados se eluyen y analizan mediante cromatografía líquida acoplada con espectrometría de masas en tándem. El análisis del espectro de fragmentación se utiliza para la identificación de alto rendimiento de los sitios de fosforilación.

A pesar de los muchos avances realizados en el análisis de fosforilación, persisten desafíos. Los péptidos muy ácidos también son capturados por columnas IMAC y, quizás lo más importante, los grupos fosfato pueden escindirse o migrar durante la fragmentación: ambos factores confunden el análisis.

Las técnicas actuales sobresalen en la identificación de sitios de fosforilación, pero son menos útiles para determinar el grado de fosforilación en un sitio en particular. El problema principal es que las versiones fosforiladas y no fosforiladas de un péptido varían en su carga y, por lo tanto, en su eficiencia de ionización. La calibración de las respuestas de los iones es un desafío para los estudios de alto rendimiento.

La glicosilación, una modificación postraduccional igualmente importante, es mucho más desafiante para las herramientas analíticas actuales. Si bien las modificaciones de la glicosilación pueden ser bastante simples, por ejemplo, consistentes en un solo ácido siálico, los glicanos se producen en una desconcertante variedad de estructuras. Su análisis generalmente procede por escisión enzimática del glucano del péptido, seguido de análisis espectrométrico de masas. Esto tiene dos limitaciones: primero, la relación entre el sitio de glicosilación y la estructura del glucano se pierde y segundo, la espectrometría de masas tiene desafíos para abordar las estructuras isoméricas.

Conclusiones

La proteómica se encuentra en una etapa de desarrollo mucho más temprana y representa un desafío analítico mucho mayor que la genómica. Estimamos que la proteómica requerirá de dos a tres décadas de desarrollo antes de que el análisis cuantitativo de proteomas completos, incluidas las modificaciones postraduccionales, se convierta en una rutina.

Si bien ahora es relativamente sencillo profundizar en un proteoma, hacerlo para el análisis cuantitativo sigue siendo costoso y requiere mucho tiempo. La identificación de modificaciones postraduccionales y la determinación de la abundancia relativa de esas modificaciones dentro de una sola muestra presentan desafíos complejos.

Un área prometedora es la proteómica in situ. Ahora es posible visualizar la distribución microscópica de metabolitos y péptidos pequeños usando imágenes MALDI (ver Figura 5).

Fig 5: Espectrometría de masas de imágenes. De Seeley & amp Caprioli, PNAS, 105, 18126 (2008)

Sin embargo, realizar análisis proteómicos con alta fidelidad espacial a través de un tejido es una tarea formidable. Entre los problemas se encuentran la deposición desigual de la matriz MALDI en el tejido y el uso de un rayo láser relativamente grande que promedia la señal a través de varias células. Otros desafíos incluyen la identificación de iones detectados y la modesta sensibilidad que tiene el enfoque.

Otros factores que la proteómica del perro son superficialmente triviales, pero siguen sin resolverse.Por ejemplo, existen enormes bancos de tejidos humanos archivados disponibles para una variedad de enfermedades, pero la mayoría de estas muestras son intratables para la generación actual de herramientas analíticas. Las muestras se fijan generalmente en formalina o se congelan. La formalina reticula las aminas primarias, y estas reticulaciones son difíciles de revertir sin pérdida y daño de la muestra. Y muchos de los bancos de tejidos congelados utilizan medios OCT (temperatura de corte óptima). Contiene grandes cantidades de polietilenglicol, que genera una señal de fondo espectral de masas compleja que interfiere con el análisis de las digestiones trípticas.

La proteómica de arriba hacia abajo, el análisis de proteínas intactas, simplifica una serie de pasos en el análisis de proteínas. Sin embargo, requiere instrumentos de muy alta resolución y muestras de proteínas de gran abundancia. Se requieren avances en instrumentación, separación de muestras y análisis de datos para hacer de la proteómica descendente una herramienta de rutina.

Como señalamos al comienzo de este manuscrito, la proteómica juega un papel importante en varias áreas de la investigación farmacéutica. Primero, las diferencias en la expresión de proteínas entre tejidos sanos y enfermos proporcionan objetivos para el desarrollo de fármacos. En segundo lugar, la preparación y el control de calidad de terapias recombinantes requieren técnicas proteómicas con un amplio rango dinámico para identificar impurezas en presencia de terapias de alta abundancia. Por último, la caracterización de la variación de la abundancia de proteínas durante el desarrollo y la progresión de la enfermedad proporcionará una comprensión profunda de la biología básica en la salud y la enfermedad.


Hongos patógenos

Los principales patógenos fúngicos de los seres humanos son Candida albicans y Aspergillus fumigatus. C. albicans es un patógeno común en la población humana y, en particular, en pacientes sometidos a quimioterapia contra el cáncer. Una revisión reciente ha descrito la aplicación de la proteómica para estudiar el diamorfismo, cambios inducidos por fármacos en el Candida proteoma, interacciones huésped-patógeno e inmunoproteómica (Rupp 2004). A. fumigatus es un hongo patógeno oportunista de pacientes inmunodeprimidos, causa aproximadamente el 4% de todas las muertes hospitalarias en Europa y es el más común Aspergilo especies asociadas con la aspergilosis invasora (IA) (Brookman y Denning 2000 Brakhage y Langfelder 2002). La tasa de mortalidad asociada con IA puede ser tan alta como 60 & # x0201390%. En particular, IA causa morbilidad y mortalidad severas en pacientes con trasplante de órganos (médula ósea y órgano sólido) y leucemia. Además, se ha estimado que más de 3500 muertes por año en los EE. UU. Son el resultado de la aspergilosis (Kontoyiannis y Bodey 2002). Se dispone de un repertorio creciente, aunque limitado, de fármacos antimicóticos para controlar la AI e incluye agentes como el voriconazol, la anfotericina B y las equinocandinas (Enoch et & # x000a0al. 2006). El desafío para la comunidad investigadora es explotar muchas tecnologías emergentes, como las estrategias de alteración de genes, el análisis de microarrays y la proteómica funcional, para ampliar nuestra comprensión de la biología de Aspergilli en general, y A. fumigatus en particular con vistas a la identificación de nuevos objetivos de fármacos antifúngicos, además de identificar enzimas con potencial biotecnológico. El propósito de este artículo es esbozar conceptos proteómicos generales y proporcionar una actualización de los estudios proteómicos fúngicos, con énfasis en los que se han llevado a cabo en A. fumigatus.


Discusión

El estrés por sequía es una de las principales limitaciones que limitan la producción de cultivos en todo el mundo. Este estrés multidimensional provoca cambios en los rasgos fisiológicos, morfológicos, bioquímicos y moleculares de las plantas. Muchas plantas han desarrollado intrincados mecanismos de resistencia para tolerar el estrés por sequía. Sin embargo, estos mecanismos varían de una especie de planta a otra. El mijo cola de zorra, como un cultivo de cereales extremadamente tolerante y resistente a la sequía, ha sido propuesto como una nueva especie modelo para el estudio genómico funcional y la investigación de tolerancia a la sequía [15, 32].

Cada vez más investigaciones en el mijo cola de zorra sometido a estrés por sequía demuestran que las proteínas funcionales desempeñan un papel clave en la respuesta al estrés [33, 34]. Un estudio transcriptómico anterior sugirió que una elaborada red reguladora regulaba positivamente el mijo cola de zorra en respuesta a la sequía. Esta red involucró múltiples procesos y vías biológicos, que incluían transducción de señales, regulación transcripcional, regulación redox, fotosíntesis y ajuste osmótico [35]. Sin embargo, las alteraciones en la expresión de proteínas, junto con las variaciones fisiológicas que ocurren en el mijo cola de zorro bajo estrés por sequía, aún requieren una investigación extensa e intensiva. En nuestro estudio, se identificaron 321 proteínas que responden a la sequía, y el análisis funcional reveló que estas proteínas estaban involucradas en la respuesta al estrés, las vías fotosintéticas y metabólicas (Tabla 1), lo que indica que múltiples mecanismos sofisticados trabajaron juntos para restablecer una nueva homeostasis celular en condiciones de sequía. estrés.

Las proteínas LEA son altamente hidrófilas y térmicamente estables, la acumulación de proteínas LEA puede proteger las estructuras celulares de las lesiones al mantener las estructuras ordenadas dentro de la célula [36]. Las acuaporinas son proteínas de membrana integrales conservadas que participan en la absorción de agua de la planta [37]. La disminución de la acuaporina K3YUP4 en condiciones de sequía puede ser beneficiosa para reducir la permeabilidad al agua de la membrana y promover la conservación del agua celular.

El sistema de defensa antioxidante en plantas sometidas a estrés por sequía está compuesto por enzimas eliminadoras de ROS. Entre ellos, CAT, SOD, APX y GPx son esenciales para eliminar ROS y actuar sinérgicamente para contrarrestar el daño oxidativo causado por el estrés por sequía [38]. En nuestros resultados, la abundancia de 13 enzimas eliminadoras de ROS y las actividades de APX, POD, CAT y SOD aumentaron (Tabla 1A y Fig.7), todo lo cual podría mejorar la resistencia a la sequía en el mijo cola de zorra.

La abundancia de proteínas ribosómicas, chaperonas proteicas y proteasas se modificó significativamente, todas las cuales desempeñan funciones fundamentales en la síntesis y modificación de proteínas, ayudando en la adaptación al estrés. A partir de nuestros datos, se identificaron 21 proteínas ribosomales que aumentaron significativamente en condiciones de sequía (Tabla 1E, Fig. 5). También se han reportado resultados similares en pepino y maíz bajo estrés [39]. Se identificó que las HSP y HSC70 tenían una acumulación significativa que podría ayudar a mantener la homeostasis de las proteínas y promover el replegamiento de las proteínas desnaturalizadas en condiciones de sequía (Tabla 1E) [40, 41]. Las cuatro proteasas, que podrían participar en la modificación y corrección de proteínas, también se identificaron acumuladas bajo sequía (Tabla 1E). Estas proteínas diferenciales y mecanismos de respuesta son consistentes con estudios previos en Arabidopsis bajo estrés salino [42].

El mantenimiento de las tasas de fotosíntesis bajo estrés por sequía es esencial para la tolerancia a la sequía en los cultivos [43]. Aquí se identificó el aumento de múltiples proteínas relacionadas con la reacción a la luz y proteínas relacionadas con el ciclo de Calvin (K3ZA91 y K3ZA66) (Fig. 5) [44]. Anteriormente se informó que el estrés por sequía podría conducir a una reducción en el CO interno2 concentración debida al cierre de los estomas [44]. El aumento del CO2 Las proteínas relacionadas con la asimilación pueden facilitar el CO2 concentración y asimilación, y a su vez contribuyen a mantener una mayor tasa fotosintética en el mijo cola de zorra bajo estrés por sequía (Cuadro 1B) (Fig. 5).

También se ha informado que la vía glucolítica responde a la sequía. En nuestros resultados, la expresión de fructoquinasa se incrementó 1,6 veces y las cantidades de enzimas relacionadas aumentaron, lo que indica un posible aumento del flujo de carbohidratos al ciclo de TCA (Tabla 1C) (Fig. 5) [39, 45 , 46]. Esto está respaldado por el aumento que vimos en la piruvato deshidrogenasa y la citrato sintasa, la piruvato deshidrogenasa cataliza la descarboxilación oxidativa del piruvato en acetil-CoA y NADH y vincula la vía de glucólisis con el ciclo de TCA, y la citrato sintasa cataliza el primer paso del ciclo de TCA. . Los resultados indican una aceleración del metabolismo del carbono, que proporcionaría más energía para la resistencia al estrés [28]. El aumento de la producción de energía dio como resultado una disminución de la síntesis de carbohidratos, lo que condujo a una reducción de la biomasa bajo estrés por sequía.

La fosforilación de proteínas reversible regulada por la quinasa y la fosfatasa es fundamental para muchas vías de señalización de diversos procesos biológicos relacionados con el estrés [47]. Nuestro estudio detectó la variación de una serina / treonina-proteína fosfatasa 2A y cuatro proteína quinasas similares a receptores (Tabla 1A). La proteína fosfatasa 2A de serina / treonina es importante en su papel como regulador de las proteínas asociadas a los microtúbulos (MAP). Esto, junto con el aumento de α / β-tubulina, sugiere que la fosforilación y la estabilización de los microtúbulos son factores clave en la respuesta a la sequía del mijo cola de zorra [48].

La abundancia de proteínas pertenecientes a diferentes vías metabólicas, incluido el metabolismo de poliaminas, biosíntesis de lignina, metabolismo de ácidos grasos, metabolismo de aminoácidos, metabolismo hormonal y metabolismo de nucleótidos (Tabla 1F), también se vieron afectadas por la sequía [49]. En la respuesta al estrés abiótico, las poliaminas, ROS (H2O2) y NO actúan sinérgicamente en la promoción de respuestas ABA en células de guarda [21, 50, 51]. En nuestro estudio, se encontró que se acumulaban tres enzimas clave involucradas en el metabolismo de la AP (Tabla 1F). El aumento de las PA sintetasas fue consistente con la acumulación de poliaminas (Fig. 6).

Las sustancias osmóticas reguladas, como la prolina y el GB, podrían mejorar la absorción de agua del suelo seco y proteger el metabolismo celular equilibrando la presión osmótica y manteniendo la turgencia celular en las células vegetales durante la sequía [52, 53]. La delta-1-pirrolina 5-carboxilasa sintetasa (P5CS) (K3XEN1) y la betaína aldehído deshidrogenasa (BADH) (K3YH74), que catalizan los pasos que limitan la velocidad de la biosíntesis de prolina y glicinabetaína (GB), respectivamente, fueron reguladas significativamente al alza para lidiar con el estrés osmótico causado por la sequía (Cuadro 1F).

La lignina es un componente básico de la pared celular secundaria de la planta, y el contenido y la composición de la lignina cambian durante el estrés abiótico y biótico [54]. Aquí, se encontró que tres proteínas relacionadas con la biosíntesis de lignina como shikimato O-hidroxicinamoil transferasa, ácido cafeico 3-O-metiltransferasa y cinamoil-CoA reductasa aumentaron, mientras que solo una proteína, 4-cumarato - CoA ligasa, se redujo bajo sequía (Cuadro 1F). Los ácidos grasos de cadena muy larga (VLCFA) son componentes importantes de la barrera protectora presente en la interfaz planta-ambiente [55]. Se encontró que la 3-cetoacil-CoA sintasa (KCS), que es responsable de la síntesis de VLCFA, está regulada al alza aproximadamente dos veces después del tratamiento de sequía. La ciclopropano sintasa de ácidos grasos también se incrementó 2,3 veces (Tabla 1F). La evidencia anterior ha sugerido que la existencia de un anillo de ciclopropano dentro de los ácidos grasos de la membrana podría mejorar la estabilidad de las membranas biológicas [56]. Los NsLTP son proteínas básicas solubles, pequeñas en las plantas, que se ha informado que están involucradas en catalizar la transferencia de fosfolípidos y juegan un papel importante en la defensa de las plantas y las respuestas al estrés [57]. Nuestros resultados sugieren un papel muy importante del metabolismo de los lípidos en la tolerancia a la sequía del mijo cola de zorra, lo que también podría explicar el aumento dramático de nsLTP (K3YAY4) en condiciones de sequía. Un estudio más profundo ayudará a comprender cómo funcionan los lípidos en los mecanismos de resistencia al estrés en el mijo cola de zorra.

Las hormonas vegetales, especialmente el ácido jasmónico (JA) y el etileno (ETH), son moléculas de señalización importantes y desempeñan un papel fundamental en la mediación de las respuestas de estrés biótico / abiótico en las plantas [58]. En esta investigación, las enzimas clave de la aleno óxido sintasa (AOS) (K3YRS9) y 1-aminociclopropano-1-carboxilato oxidasa (ACO) (K3ZV70), que catalizan el primer y último paso de la biosíntesis de JA y ETH respectivamente, aumentaron. en abundancia en condiciones de sequía (Cuadro 1F). Estos resultados demostraron además que la vía metabólica de las fitohormonas también participa en los procesos de respuesta al estrés.

También realizamos un análisis correlativo de transcriptómica-proteómica, en el que se identificaron las transcripciones correspondientes de sólo 23 proteínas diferenciales en nuestro estudio de proteómica (archivo adicional 7: Tabla S6) [15]. La débil correlación entre los datos transcriptómicos y proteómicos fue consistente con los resultados de informes anteriores en otras especies. Como proteínas, las isoformas y sus abundancias no solo están reguladas a nivel de transcripción, sino también a nivel postranscripcional, traduccional y postraduccional. Los resultados confirmaron la percepción establecida anteriormente de que los niveles de transcripción no se correlacionan directamente con los niveles de expresión de proteínas [14, 28, 39, 46], y la regulación postranscripcional desempeña un papel vital en la expresión génica [59].

De este estudio se pudo concluir que las proteínas que participaron en el metabolismo energético y la síntesis de materiales protectores obviamente cambiaron, y el contenido de la mayoría de ellas se mejoró dramáticamente. Estos cambios contribuyen aún más a proteger las células vegetales evitando daños por defectos de agua y a mantener el crecimiento del mijo cola de zorro en condiciones de sequía. Estos fueron consistentes con estudios proteómicos previos de plantas de genotipo tolerantes a la sequía bajo sequía [43].

En total, el perfil proteómico obtenido en esta investigación ha ofrecido conocimientos completos sobre los diversos mecanismos de tolerancia a la sequía en el mijo cola de zorra, y se necesitan estudios más detallados para determinar las proteínas clave y las vías de las plantas bajo estrés.


La tripsina se escinde exclusivamente C-terminal en residuos de arginina y lisina

Casi todos los proyectos a gran escala de proteómica basada en espectrometría de masas utilizan tripsina para convertir mezclas de proteínas en poblaciones de péptidos más fácilmente analizables. Cuando se buscan espectros de fragmentación de péptidos frente a bases de datos de secuencias, se puede requerir que las secuencias de péptidos potencialmente coincidentes se ajusten a la especificidad tríptica, es decir, escisión exclusivamente C-terminal a arginina o lisina. Sin embargo, en muchos informes publicados, los péptidos no trípticos identifican un número significativo de proteínas. Aquí utilizamos las subpartes por millón de precisión de masa de un nuevo espectrómetro de masas de transformada de Fourier con trampa de iones para lograr una confianza 100 veces mayor en la identificación de péptidos en comparación con los experimentos típicos de trampa de iones y demostrar que la tripsina escinde únicamente C-terminal a arginina y lisina. Encontramos que los péptidos no trípticos ocurren solo como péptidos C-terminales de proteínas y como productos de ruptura de péptidos completamente trípticos N-terminales a una prolina interna. La simulación de una precisión de masa más baja condujo a una gran cantidad de proteínas identificadas erróneamente con péptidos no trípticos. Nuestros resultados indican que tales impactos de péptidos en estudios previos deben ser reexaminados y que la identificación de péptidos debe basarse en una estricta especificidad de tripsina.


Ver el vídeo: Σύνδρομο Ευερέθιστου Εντέρου: Αντιμετωπίζεται! (Agosto 2022).