GitHub - philschmid/gemini-samples
Extracto
Contribute to philschmid/gemini-samples development by creating an account on GitHub.
Resumen
Resumen Principal
Este repositorio es una colección exhaustiva de recursos prácticos diseñada para facilitar la exploración e implementación de los avanzados modelos de inteligencia artificial Google DeepMind Gemini y Gemma. Ofrece una gama diversificada de ejemplos, fragmentos de código y guías detalladas que cubren desde integraciones básicas hasta funcionalidades experimentales. Los usuarios pueden aprender a integrar Gemini con el SDK de OpenAI, habilitar la búsqueda de Google para obtener información en tiempo real, y generar salidas JSON estructuradas utilizando Pydantic y meta prompts dinámicos. Además, el repositorio explora capacidades multimodales como la transcripción de audio con marcas de tiempo precisas y el análisis de videos de YouTube, así como la generación nativa de imágenes con el modelo experimental Gemini 2.0 Flash. Para el modelo Gemma, se proporcionan ejemplos sobre su uso con el SDK de Google GenAI y la implementación de la llamada a funciones. En conjunto, estos recursos representan un punto de partida invaluable para desarrolladores y entusiastas que buscan experimentar y construir aplicaciones innovadoras con las tecnologías de IA de Google.
Elementos Clave
- Capacidades Avanzadas de Gemini: El repositorio destaca la versatilidad de los modelos Gemini a través de diversas funcionalidades. Incluye ejemplos de integración con el SDK de OpenAI y la capacidad de conectar Gemini con Google Search para acceder a datos actualizados. Esto subraya su adaptabilidad para casos de uso que requieren tanto un marco de desarrollo familiar como información en tiempo real.
- Generación de Salidas Estructuradas y Multimodales: Se enfatiza la habilidad de Gemini para producir salidas JSON estructuradas utilizando Pydantic, y la creación dinámica de esquemas mediante meta prompts. También se cubren funcionalidades multimodales críticas como la transcripción de audio con marcas de tiempo precisas y el análisis y transcripción de videos de YouTube, mostrando el potencial de Gemini en el procesamiento de medios complejos.
- Innovación en Interacción y Creación de Contenido: El repositorio presenta una guía completa sobre la llamada a funciones (Function Calling), permitiendo a los modelos interactuar con sistemas externos. Un aspecto notable y experimental es la demostración de la generación nativa de imágenes directamente con el modelo Gemini 2.0 Flash, lo que abre nuevas fronteras para la creación de contenido
Contenido
Google DeepMind Models Samples, Snippets and Guides
This repository contains personal tiny samples, snippets and guides showcasing cool experiments and implementations using Google DeepMind Gemini models.
Examples
- Gemini with OpenAI SDK - Use Gemini models with the OpenAI SDK
- Gemini with Google Search - Enable Google Search integration for up-to-date information
- Structured Outputs - Generate structured JSON outputs using Pydantic
- Meta Prompts - Generate JSON schemas dynamically using meta prompts
- Audio Transcription - Transcribe audio with precise timestamps
- Gemini MCP Example - Example showcasing Model-Code Pairing (MCP)
- Gemini Analyze & Transcribe YouTube - Analyze and transcribe YouTube videos
- Function Calling Guide - Comprehensive guide on implementing function calling
- Gemini Native Image Output - Generate images directly with Gemini 2.0 Flash experimental model
JavaScript Examples
- Gemini Native Image Output - Generate images directly with Gemini 2.0 Flash experimental model
Gemma
- Gemma with GenAI SDK - Use Gemma 3 27B It with Google's GenAI API
- Gemma Function Calling - Implement function calling with Gemma 3 27B
Repository Structure
├── examples/
│ └── gemini-with-openai-sdk.ipynb
├── guides/
│ └── function-calling.ipynb
├── LICENSE
└── README.md
How to Use
-
Clone the repository:
git clone https://github.com/philschmid/gemini-samples.git
-
Set up environment variables: Create a
.envfile in the root directory:GEMINI_API_KEY=your_api_key_here -
Explore the examples: Browse the sample notebooks to find code related to different DeepMind models and experiments.
-
Run and modify: Experiment with the code, tweak parameters, and integrate the snippets into your own projects.
Contributing
Contributions are welcome! If you have additional examples or improvements, please feel free to open a pull request or create an issue.
License
This repository is licensed under the MIT License. See the LICENSE file for more details.
Fuente: GitHub