¿Qué es Géminis? Todo lo que necesitas saber sobre la herramienta de inteligencia artificial de Google

Desde que ChatGPT causó sensación, las empresas de tecnología han estado compitiendo para liberar competidores de IA, y Google ha intensificado su juego de IA con Gemini.

Presentado por Google DeepMind en diciembre de 2023, este modelo de próxima generación está integrado en la línea de productos de Google, incluidos Google Search y Workspace, e incluso los teléfonos Pixel, lo que hace que estas herramientas sean más inteligentes, con mayor capacidad de respuesta e intuitivas.

Entonces, ¿qué es un Géminis? Es un modelo de lenguaje grande diseñado para comprender y generar texto muy similar a lo que podría escribir un humano. Está diseñado para integrar inteligencia artificial avanzada en las interacciones cotidianas de los usuarios y en soluciones empresariales complejas, y puede interactuar con Google LLM a través del chatbot Gemini en la web o la aplicación móvil.

Gemini tiene cuatro modelos: Ultra, Pro, Flash y Nano, cada uno diseñado para diferentes casos de uso. Otra característica nueva es la ventana de contexto de token extendida, que permite respuestas más avanzadas y consistentes. El Gemini 1.5 Flash ahora ofrece una ventana de 1 millón de tokens, mientras que el modelo 1.5 Pro aumenta esta ventana a 2 millones. En comparación, ChatGPT cubre 32.000 tokens en su versión extendida.

Si todavía no ha desarrollado una debilidad por todo lo relacionado con la IA y todo suena confuso, siga leyendo.

Terminología común de IA: LLM, IA generativa, chatbots, tokens

Con el desarrollo de la tecnología surge una nueva terminología de inteligencia artificial. Antes de profundizar más, analicemos rápidamente los términos clave mencionados anteriormente.

La IA generativa (o IA genética) se refiere a sistemas de IA que pueden pensar en contenido (texto, imágenes o incluso música) basándose en datos entrenados. Los LLM como Gemini son un tipo de IA generativa. Aprenden de grandes conjuntos de datos de texto y código y luego utilizan ese conocimiento para comprender y generar texto similar al humano.

Es posible que haya interactuado con LLM a través de un chatbot de servicio al cliente en línea o incluso ChatGPT.

Icono de insignia de arte AI Atlas

Estos chatbots utilizan LLM para entablar conversaciones en tiempo real, brindarle información y resolver problemas, aunque a veces fallan y dan respuestas extrañas. Éstas se denominan alucinaciones de IA. Y Google ha tenido una buena cantidad de contratiempos con ellos. Pero hablaremos de eso más adelante.

Los tokens son los componentes básicos del texto que los modelos de IA utilizan para procesar el lenguaje. Cuando la IA lee y genera texto, lo divide todo en pequeños fragmentos llamados tokens. Pueden ser palabras completas, partes de palabras o incluso signos de puntuación. Por ejemplo, “¡Hola mundo!” incluido La IA puede tratar “Hola” y “,” como tokens separados.

Entonces, cuando hablamos de límites de tokens (como la ventana de contexto de un millón de tokens antes mencionada de Gemini), estamos hablando de cuánto puede “recordar” la IA para mantener la conversación consistente y relevante.

Una cosa a tener en cuenta: como cualquier tecnología nueva, Gemini todavía se está desarrollando y la IA mejora cada día.

Gemini en teléfonos Pixel y búsqueda de Google

Pliegue del Pixel 9 Pro Pliegue del Pixel 9 Pro

Pliegue del Pixel 9 Pro

James Martín/CNET

Entonces, ¿cómo juega Gemini en los dispositivos que usas todos los días? Para empezar, está integrado en los teléfonos Pixel de Google y potencia muchas de las funciones de inteligencia artificial de los teléfonos.

Probablemente hayas utilizado tu Pixel para transcribir un mensaje de voz o redactar un correo electrónico rápido. Es Géminis haciendo su magia en el fondo. Básicamente, ayuda al Pixel a hacer las cosas de forma más rápida e intuitiva.

Gemini también juega un papel importante en la descripción general de la IA de la Búsqueda de Google. Si ha notado que aparecen respuestas más detalladas y ricas en contexto en la parte superior de sus búsquedas, es gracias a la integración. Gemini ayuda a dividir temas complejos en pequeñas explicaciones en los resultados de búsqueda.

En la presentación AI Overviews de Google, fue criticado por aconsejar a los usuarios comer piedras todos los días y poner pegamento en las recetas de pizza. Google respondió inmediatamente y desde entonces ha afinado su instrumento.

Todos los usuarios estadounidenses mayores de 13 años que administren su propia cuenta de Google tienen acceso a información general sobre IA. En otros países como Reino Unido, India, México, Brasil, Indonesia y Japón, los usuarios mayores de 18 años también pueden utilizar esta función. Google quiere continuar su expansión global y pretende llegar a más de mil millones de usuarios a finales de 2024.

Ahora bien, a algunas personas no les gusta esta función y la desventaja es que no se puede desactivar la descripción general de la IA. Sin embargo, hemos analizado algunas soluciones que pueden ayudar con esto.

Solución al fiasco de la creación de imágenes populares con nuevos lanzadores

El teléfono móvil Pixel 9 de Google El teléfono móvil Pixel 9 de Google

James Martín/CNET

Cuando Gemini se lanzó por primera vez, las cosas no tardaron en torcerse. Google ha enfrentado críticas por algunas de las alucinaciones y por cómo retrataba personajes históricos y diferentes razas. Llegó a los titulares por presentar a soldados nazis negros y asiáticos, lo cual, como puedes imaginar, no fue bien recibido. Los críticos han acusado a Google de esforzarse demasiado en promover la diversidad, pero en lugar de eso empeora las cosas. Google ha puesto freno a la imagen de Gemini y ha prometido limpiar el desastre.

El 28 de agosto, después de mejorar la tecnología, Google anunció la última versión de su herramienta de conversión de texto a imagen, Imagen 3, que pronto estará disponible para los suscriptores de Gemini Advanced, Business y Enterprise. Sin embargo, la capacidad de crear imágenes de personas todavía está en suspenso porque esta vez Google va a lo seguro.

A principios del 13 de agosto, Google lanzó Gemini Live para suscriptores avanzados en dispositivos Android, con planes de expandirse a iOS pronto. Gemini Live ofrece chats manos libres en tiempo real con 10 nuevas opciones de voz, incluso en segundo plano o cuando el teléfono está bloqueado. Puedes pausar y reanudar la conversación cuando quieras, lo cual es una característica muy interesante.

Precio y acceso

Gemini es gratuito como asistente personal de IA y ofrece acceso al modelo Flash 1.5 con una ventana contextual de 32.000 tokens, perfecta para conversaciones largas de ida y vuelta. Pero para funciones más avanzadas, Gemini tiene varios planes de suscripción:

  • Gemini Advanced con modelo 1.5 Pro: $20 por mes.
  • negocio geminis: $20 por usuario por mes en un plan anual, o $24 si pagas mensualmente.
  • Empresa Géminis: $30 por usuario por mes en el plan anual, precio especial a través del equipo de ventas de Google.

Para desarrolladores y empresas, Google ha implementado un sistema de precios escalonado para los modelos API de Gemini, como Flash y Pro. Los desarrolladores pueden acceder a ellos a través de los servicios API de Google Cloud e integrar capacidades de IA directamente en las aplicaciones.

Ambos modelos ofrecen el uso de IA escalable con diferencias de precio y límite de tarifas según el nivel y la longitud del token. Puedes consultar las tarifas de precios detalladas. sitio oficial de google. También hay un nivel gratuito que te permite probarlo con un uso limitado, ideal para probar las aguas antes de dar el paso.

Continúe leyendo para ver la revisión completa de CNET del Gemini.



Fuente