Antrópico: la fuerza impulsora detrás de Claude 3.5, el rival más poderoso de GPT-4, ¿cómo crear un modelo de lenguaje de IA a gran escala más "compatible"?

0710 antrópico

Prefacio

El 20 de junio de 2024, Anthropic, una startup de inteligencia artificial formada por el antiguo equipo de ingeniería de OpenAI, lanzó Claude 3.5 Sonnet. Anthropic declaró en Twitter que Sonnet corre dos veces más rápido que su predecesor Claude 3 Opus y es mejor en razonamiento, programación y muchos. pruebas como la visualización superaron al GPT-4 de OpenAI.

Antrópico3

Con una gran cantidad de fondos de la industria tecnológica fluyendo hacia el campo de la IA, al comprender el estado de recaudación de fondos y los conceptos detrás de varias nuevas empresas de IA, también podemos tener una comprensión más clara de las tendencias futuras de la inteligencia artificial.

Tomando como ejemplo la creación de IA generativa y modelos de lenguaje a gran escala, OpenAI no es el único que sobresale. Está respaldado por enormes inversiones de los gigantes tecnológicos Amazon y Google, que sin duda se ha convertido en el unicornio más destacado de este año. después de OpenAI.

¿Qué tipo de empresa es Anthropic? ¿Por qué los fundadores se separaron de OpenAI? ¿Cuál es la diferencia entre las posiciones estratégicas de las dos empresas?

¡Hoy voy a compartir contigo la historia de Anthropic!

Antrópico4

3 conclusiones si solo tienes 1 minuto

  1. La diferencia entre Anthropic y OpenAI:
    Anthropic se centra en el desarrollo de tecnología de IA segura y transparente y está comprometido con la explicabilidad y controlabilidad de los sistemas de IA. Al mismo tiempo, el método de capacitación es más "constitucional". El proceso de capacitación determinará el modelo a considerar a través de la retroalimentación humana (RLHF). Los valores de la cultura industrializada, no occidental, no rica o son adecuados para aplicaciones que requieren un alto grado de confiabilidad y ética. Por el contrario, OpenAI se centra en potentes capacidades de generación y flexibilidad de procesamiento del lenguaje natural, y es adecuado para diversos escenarios, como entretenimiento, educación y aplicaciones comerciales en general.

  2. Diferencias en posiciones estratégicas de los centros comerciales:
    Anthropic es popular en industrias de alto riesgo como las finanzas, la medicina y el derecho porque sus productos pueden proporcionar explicaciones detalladas de las fuentes de datos y los procesos de toma de decisiones, lo que hace que el proceso de interacción con los humanos sea más transparente y confiable.
    OpenAI tiene mayor visibilidad y cobertura en el mercado, especialmente en industrias como el entretenimiento y la educación que requieren capacidades de generación flexibles y naturales.

  3. Perspectivas antrópicas:
    En términos de expandir su territorio comercial, poco después de que OpenAI lanzara GPT 4o, Anthropic también anunció que Claude se lanzó en Europa y comenzó a admitir múltiples idiomas como francés, alemán, italiano y español, avanzando hacia una mayor diversificación. y una mayor cobertura. Avanzar rápidamente.
    Porque Europa siempre ha sido una de las regiones más ruidosas en materia de seguridad y regulación de la inteligencia artificial, especialmente la Ley de Inteligencia Artificial aprobada a principios de este año. El cofundador Amodei dijo que Anthropic se ha comprometido a cumplir con las regulaciones de inteligencia pública como el GDPR de la UE y está listo para operar dentro del marco europeo.

    En términos de experiencia de usuario, Anthropic también espera que los usuarios puedan interactuar con Claude de la forma más intuitiva, ya sea a través de teléfonos móviles, ordenadores personales o la propia API. Actualmente, también están creando activamente una experiencia muy fluida para que los usuarios de Claude puedan cambiar libremente entre diferentes cuentas y diferentes dispositivos.

 

Antecedentes fundacionales

Antrópico1

Anthropic fue fundada en 2021 por los hermanos Darío y Daniela Amodei, ex ejecutivos de OpenAI. Los otros cinco miembros también son de OpenAI. Anthropic se fundó a partir de dudas sobre el proceso de desarrollo de OpenAI, con la esperanza de encontrar otra forma de desarrollar un sistema de IA humano y seguro a través de métodos de capacitación más rigurosos para garantizar que el proceso de aplicación de IA pueda seguir siendo transparente y seguro.

La filosofía central de Anthropic: crear CAI (Inteligencia Artificial Constitucional)

CAI (IA constitucional) ¿qué es?

CAI es la abreviatura de "IA Constitucional".

Explica CAI en una frase: IA entrenada con un conjunto de estándares que cumplen con la normativa vigente.

Se puede imaginar que existe una "constitución" en el proceso de entrenamiento de la IA. Esta constitución le dice a la IA qué hacer en diversas situaciones es correcto y seguro, de modo que el contenido del resultado pueda estar más en línea con las normas morales y legales actuales. y al mismo tiempo hacer más transparente el proceso de formación.
La "Constitución de IA" creada por Anthropic extrae sus regulaciones de documentos como la Declaración Universal de Derechos Humanos de las Naciones Unidas, así como de la experiencia del equipo interno en la interacción con la IA.

Antrópico7

¿Cómo se formuló la constitución de IA detrás de CAI?

Anthropic desarrolló esta constitución de IA principalmente a través de encuestas de opinión pública:

Invitaron a unos 1.000 estadounidenses de diferentes edades, géneros, ingresos y regiones a participar en la formulación de una constitución de IA en la plataforma de votación de código abierto Polis, permitiéndoles votar sobre algunas reglas existentes de IA de acuerdo con sus propios grupos étnicos y posiciones. una sugerencia.
Después de recopilar aproximadamente 1200 sugerencias diversas y 38 200 votos, el equipo de Anthropic filtró aún más las reglas con las que la mayoría de la gente estaba de acuerdo. Finalmente, estas reglas se organizan en una constitución de IA, que se utiliza como guía para entrenar nuevos sistemas de IA.

Antrópico2

Alineación de la IA: ¿Alinear la IA con los valores humanos?

La alineación de la IA se refiere a hacer que la IA sea "consistente" con los valores humanos, y el método CAI de Anthropic está diseñado para lograr este objetivo.

¿Pero cómo?
Al estudiar la tecnología central, la interpretabilidad mecánica (interpretabilidad mecánica/capacidad de explicación del modelo), Anthropic es similar a abrir el cerebro de un robot, lo que permite a los desarrolladores comprender claramente cómo opera el sistema interno de IA, cómo produce cada oración y cómo piensa. Supervisar estrictamente el proceso de pensamiento de la inteligencia artificial, en lugar de centrarse únicamente en la calidad de los resultados.

Antrópico5

Antrópico versus OpenAI 

 

Tanto Anthropic como OpenAI están comprometidos con la construcción de modelos de lenguaje a gran escala, pero Claude de Anthropic está más centrado en desarrollar sistemas de IA que puedan "explicar claramente el proceso de pensamiento" y que sean más compatibles y controlables.

Por el contrario, ChatGPT de OpenAI se centra más en la flexibilidad del modelo y desarrolla tecnologías de IA generales más potentes, como voz más accesible, reconocimiento de imágenes, salida de imágenes, etc.
Debido a que los propósitos de la capacitación son diferentes, aunque OpenAI ha establecido firmemente su posición en la cobertura de usuarios, Anthropic será una opción más adecuada para las empresas que requieren estrictamente seguridad y explicabilidad de la IA.

¿Cuál es la diferencia entre los dos métodos de entrenamiento de IA?

Antrópico: Aprendizaje por refuerzo con retroalimentación humana (RLHF)
OpenAI: datos a gran escala y aprendizaje profundo

Anthropic espera desarrollar un sistema de IA más transparente, por lo que pondrá más énfasis en la controlabilidad y las capacidades de explicación del modelo de IA durante el proceso de capacitación. Anthropic utiliza principalmente aprendizaje por refuerzo y retroalimentación humana (RLHF), y el equipo se centrará en garantizar la seguridad y confiabilidad del sistema de inteligencia artificial en varios escenarios.
Por el contrario, OpenAI espera que el resultado pueda ser diverso y flexible, por lo que se centra más en datos a gran escala y aprendizaje profundo para maximizar el rendimiento y las capacidades de generación del modelo de IA. Por ejemplo, GPT-4 utiliza una gran cantidad de datos de texto para el entrenamiento previo para mejorar el procesamiento del lenguaje natural y la diversidad de generación del modelo.

 

¿Cuáles son las diferencias entre los dos modelos de lenguaje?

Tomando el texto resultante como ejemplo, las diferencias más obvias entre los dos modelos son:

Antrópico (Claude)

  1. Alta transparencia de contenido:
    Claude proporciona una explicación detallada del proceso y las fuentes de datos, explicando qué modelos científicos utiliza para predecir y analizar.
  2. Cumplimiento:
    Las respuestas de Claude son generalmente más dóciles y adecuadas para áreas donde se deben seguir estándares legales y éticos estrictos.

OpenAI (ChatGPT)

  1. Más flexible y natural:
    La respuesta de ChatGPT se centra más en generar texto natural y fluido, proporcionando explicaciones claras y concisas, adecuadas para una amplia gama de interacciones y diversos escenarios de aplicación, como entretenimiento, educación y aplicaciones comerciales en general.
  1. Sea más creativo:
    Las capacidades de generación de ChatGPT son poderosas, capaces de manejar una gama más amplia de temas y brindar una rica experiencia interactiva.

 

Tengamos una experiencia más concreta. ¿Cómo responderán los dos modelos al mismo mensaje?

Tomemos como ejemplo “Explicar las causas y efectos del cambio climático”.

La respuesta de Claudio:

“El cambio climático se refiere a cambios en los patrones climáticos a largo plazo de la Tierra, causados principalmente por el aumento de las emisiones de gases de efecto invernadero causados por las actividades humanas. La quema de combustibles fósiles (como el carbón, el petróleo y el gas natural) y la deforestación son causas importantes del aumento del efecto invernadero. gases.
Estos gases (como el dióxido de carbono y el metano) se acumulan en la atmósfera, formando un 'invernadero' que aumenta la temperatura de la Tierra.
Este efecto invernadero provoca un aumento de los fenómenos meteorológicos extremos, el aumento del nivel del mar y cambios en los ecosistemas, lo que a su vez afecta a la salud humana, la producción agrícola y el suministro de agua. "

“Utilizamos múltiples modelos científicos para simular y predecir los impactos del cambio climático, que se ajustan en función de datos históricos y tendencias actuales.
Nuestro análisis considera las emisiones de gases de efecto invernadero en diferentes escenarios y evalúa su impacto potencial en las temperaturas globales y los patrones climáticos. Estos modelos y datos provienen de organizaciones autorizadas como el IPCC (Panel Intergubernamental sobre Cambio Climático). "

La respuesta de ChatGPT

"El cambio climático es causado por la combinación de actividades humanas y factores naturales. Durante las actividades humanas, la quema de combustibles fósiles libera grandes cantidades de dióxido de carbono, un importante gas de efecto invernadero que calentará la Tierra.
Además, la deforestación reduce la absorción de dióxido de carbono, exacerbando el calentamiento climático. Los factores naturales como las erupciones volcánicas y los cambios en la radiación solar también afectan el clima, pero bajo la influencia de las actividades humanas, estos factores naturales desempeñan un papel relativamente pequeño.
Los impactos del cambio climático incluyen un aumento de los fenómenos meteorológicos extremos, el aumento del nivel del mar, el derretimiento de los glaciares, daños a los ecosistemas y problemas de salud humana. Estos cambios podrían conducir a una reducción de la producción agrícola, escasez de agua y más refugiados climáticos.

 

Es obvio que Claude explicará el proceso con razonamientos claros y adjuntará fuentes de referencia;
ChatGPT es más fácil de usar y utiliza un lenguaje más simple y fácil de entender para ayudar a los usuarios a comprender.

Para comparar los dos modelos de una manera más antropomórfica:

poder poner Claude imagina a un profesor amable pero algo serio, muy atento a las emociones y la seguridad de sus alumnos. Asegúrese de que sus palabras y acciones no dañen a los estudiantes a través de un estricto código de ética (CAI). Al mismo tiempo, nos comunicamos frecuentemente con los estudiantes y los padres (votación regular de código abierto) y ajustamos los métodos de enseñanza después de adoptar las opiniones de los estudiantes para satisfacer mejor las expectativas y necesidades de todos.

En comparación, GPT es más interesante pero menos controlado. Puede imaginar que GPT es un profesor muy inteligente que puede enseñar a los estudiantes según sus aptitudes. Tiene un gran conocimiento y puede responder varias preguntas y brindar explicaciones detalladas. Pero a veces se puede pasar por alto la diversidad de los antecedentes de los estudiantes o no se consideran temas delicados que pueden ser perjudiciales para algunos estudiantes.

Anthropic y OpenAI, una comparación de sus posiciones estratégicas en el campo de batalla de la IA

 

En la industria de la IA actual, Anthropic y OpenAI ocupan cada uno una posición estratégica importante.

Debido a que Anthropic se centra más en la seguridad y la transparencia de la tecnología de IA, es favorecida por empresas de industrias con mayores riesgos y requisitos de cumplimiento, como las financieras, médicas y legales. Los productos de IA que enfatizan la interpretabilidad pueden ayudar a estas industrias a comprender y aplicar mejor la tecnología de IA.

OpenAI se dirige a una gama más amplia de usuarios. Debido a la producción de contenido flexible y la cartera de productos diversificada de ChatGPT, ocupa una amplia participación del mercado actual. Especialmente en entretenimiento, educación y aplicaciones comerciales en general, tiene mayor visibilidad y uso.

 

Estado de inversión antrópica

Antrópico6

 

 Anthropic ha recaudado casi 8 mil millones de dólares hasta ahora, con una valoración posterior a la inversión de aproximadamente 18,4 mil millones de dólares, de los cuales más de 7 mil millones de dólares provinieron de la inversión de 4 mil millones de dólares de Amazon para colaborar en la construcción de chatbots inteligentes en AWS y los 2 mil millones de dólares posteriores de Google; mil millones de aumento, esperamos colaborar con su centro de investigación de IA DeepMind para crear aplicaciones de IA más seguras.

Aunque estas inversiones aún no equivalen a los 10 mil millones de dólares que Microsoft invirtió en OpenAI, aún muestran que habrá caras más diversas en el campo de batalla de la IA en el futuro.



El futuro de Anthropic

En términos de expandir su territorio comercial, poco después de que OpenAI lanzara GPT 4o, Anthropic también anunció que Claude se lanzó en Europa y comenzó a admitir múltiples idiomas como francés, alemán, italiano y español, avanzando hacia una mayor diversificación. y una mayor cobertura. Avanzar rápidamente.
Porque Europa siempre ha sido una de las regiones más ruidosas en materia de seguridad y regulación de la inteligencia artificial, especialmente la Ley de Inteligencia Artificial aprobada a principios de este año. El cofundador Amodei dijo que Anthropic se ha comprometido a cumplir con las regulaciones de inteligencia pública como el GDPR de la UE y está listo para operar dentro del marco europeo.

En términos de experiencia de usuario, Anthropic también espera que los usuarios puedan interactuar con Claude de la forma más intuitiva, ya sea a través de teléfonos móviles, ordenadores personales o la propia API. Actualmente, también están creando activamente una experiencia muy fluida para que los usuarios de Claude puedan cambiar libremente entre diferentes cuentas y diferentes dispositivos.

3 conclusiones

 

  1. La diferencia entre Anthropic y OpenAI:
    Anthropic se centra en el desarrollo de tecnología de IA segura y transparente y está comprometido con la explicabilidad y controlabilidad de los sistemas de IA. Al mismo tiempo, el método de capacitación es más "constitucional". El proceso de capacitación determinará el modelo a considerar a través de la retroalimentación humana (RLHF). Los valores de la cultura industrializada, no occidental, no rica o son adecuados para aplicaciones que requieren un alto grado de confiabilidad y ética. Por el contrario, OpenAI se centra en potentes capacidades de generación y flexibilidad de procesamiento del lenguaje natural, y es adecuado para diversos escenarios, como entretenimiento, educación y aplicaciones comerciales en general.

  2. Diferencias en posiciones estratégicas de los centros comerciales:
    Anthropic es popular en industrias de alto riesgo como las finanzas, la medicina y el derecho porque sus productos pueden proporcionar explicaciones detalladas de las fuentes de datos y los procesos de toma de decisiones, lo que hace que el proceso de interacción con los humanos sea más transparente y confiable.
    OpenAI tiene mayor visibilidad y cobertura en el mercado, especialmente en industrias como el entretenimiento y la educación que requieren capacidades de generación flexibles y naturales.

  3. Perspectivas antrópicas:
    En términos de expandir su territorio comercial, poco después de que OpenAI lanzara GPT 4o, Anthropic también anunció que Claude se lanzó en Europa y comenzó a admitir múltiples idiomas como francés, alemán, italiano y español, avanzando hacia una mayor diversificación. y una mayor cobertura. Avanzar rápidamente.
    Porque Europa siempre ha sido una de las regiones más ruidosas en materia de seguridad y regulación de la inteligencia artificial, especialmente la Ley de Inteligencia Artificial aprobada a principios de este año. El cofundador Amodei dijo que Anthropic se ha comprometido a cumplir con las regulaciones de inteligencia pública como el GDPR de la UE y está listo para operar dentro del marco europeo.

    En términos de experiencia de usuario, Anthropic también espera que los usuarios puedan interactuar con Claude de la forma más intuitiva, ya sea a través de teléfonos móviles, ordenadores personales o la propia API. Actualmente, también están creando activamente una experiencia muy fluida para que los usuarios de Claude puedan cambiar libremente entre diferentes cuentas y diferentes dispositivos.

 

Conclusión

CEO antrópico enEntrevista la semana pasadaEl informe menciona que el costo del entrenamiento en inteligencia artificial sigue siendo terriblemente alto. Un modelo básico y de gama baja cuesta alrededor de 100 millones de dólares, y entrenar el Cluade en mano cuesta más de mil millones de dólares.

De ello se deduce que el altísimo costo del desarrollo de la inteligencia artificial ha puesto el listón alto para las nuevas empresas que quieren entrenar sus propios modelos para competir con OpenAI o Anthropic, y el campo de batalla para los grandes modelos de lenguaje seguirá dominado en el corto plazo. por gigantes tecnológicos con enormes cantidades de dinero.

El surgimiento de Anthropic permite a las personas tener imaginaciones más diversas sobre la aparición de modelos de lenguaje a gran escala de IA y también implementa soluciones por adelantado para los problemas éticos que la IA puede causar en el futuro.

¡Gracias por leer este artículo!
Si cree que todavía tiene más que aprender, suscríbase a mi boletín [Charla técnica de Roxanne]
¡Compartiré más historias interesantes de ciencia y tecnología al respecto! 🥳

Únase a 500 personas y aprendan juntos la última tecnología y conocimientos Suscríbete a la charla técnica de Roxanne
También puedes comunicarte a través de Linkedin👩🏻‍💻 Roxanne Chen



Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

es_ESEspañol