Absortio

Email → Summary → Bookmark → Email

GitHub - philschmid/gemini-samples

Extracto

Contribute to philschmid/gemini-samples development by creating an account on GitHub.

Resumen

Resumen Principal

Este repositorio es una colección exhaustiva de recursos prácticos diseñada para facilitar la exploración e implementación de los avanzados modelos de inteligencia artificial Google DeepMind Gemini y Gemma. Ofrece una gama diversificada de ejemplos, fragmentos de código y guías detalladas que cubren desde integraciones básicas hasta funcionalidades experimentales. Los usuarios pueden aprender a integrar Gemini con el SDK de OpenAI, habilitar la búsqueda de Google para obtener información en tiempo real, y generar salidas JSON estructuradas utilizando Pydantic y meta prompts dinámicos. Además, el repositorio explora capacidades multimodales como la transcripción de audio con marcas de tiempo precisas y el análisis de videos de YouTube, así como la generación nativa de imágenes con el modelo experimental Gemini 2.0 Flash. Para el modelo Gemma, se proporcionan ejemplos sobre su uso con el SDK de Google GenAI y la implementación de la llamada a funciones. En conjunto, estos recursos representan un punto de partida invaluable para desarrolladores y entusiastas que buscan experimentar y construir aplicaciones innovadoras con las tecnologías de IA de Google.

Elementos Clave

  • Capacidades Avanzadas de Gemini: El repositorio destaca la versatilidad de los modelos Gemini a través de diversas funcionalidades. Incluye ejemplos de integración con el SDK de OpenAI y la capacidad de conectar Gemini con Google Search para acceder a datos actualizados. Esto subraya su adaptabilidad para casos de uso que requieren tanto un marco de desarrollo familiar como información en tiempo real.
  • Generación de Salidas Estructuradas y Multimodales: Se enfatiza la habilidad de Gemini para producir salidas JSON estructuradas utilizando Pydantic, y la creación dinámica de esquemas mediante meta prompts. También se cubren funcionalidades multimodales críticas como la transcripción de audio con marcas de tiempo precisas y el análisis y transcripción de videos de YouTube, mostrando el potencial de Gemini en el procesamiento de medios complejos.
  • Innovación en Interacción y Creación de Contenido: El repositorio presenta una guía completa sobre la llamada a funciones (Function Calling), permitiendo a los modelos interactuar con sistemas externos. Un aspecto notable y experimental es la demostración de la generación nativa de imágenes directamente con el modelo Gemini 2.0 Flash, lo que abre nuevas fronteras para la creación de contenido

Contenido

Google DeepMind Models Samples, Snippets and Guides

This repository contains personal tiny samples, snippets and guides showcasing cool experiments and implementations using Google DeepMind Gemini models.

Examples

JavaScript Examples

Gemma

Repository Structure

├── examples/
│   └── gemini-with-openai-sdk.ipynb
├── guides/
│   └── function-calling.ipynb
├── LICENSE
└── README.md

How to Use

  1. Clone the repository:

    git clone https://github.com/philschmid/gemini-samples.git
  2. Set up environment variables: Create a .env file in the root directory:

    GEMINI_API_KEY=your_api_key_here
    
  3. Explore the examples: Browse the sample notebooks to find code related to different DeepMind models and experiments.

  4. Run and modify: Experiment with the code, tweak parameters, and integrate the snippets into your own projects.

Contributing

Contributions are welcome! If you have additional examples or improvements, please feel free to open a pull request or create an issue.

License

This repository is licensed under the MIT License. See the LICENSE file for more details.

Fuente: GitHub