GitHub - philschmid/gemini-samples

https://github.com/philschmid/gemini-samples • Apr 2, 2025 20:52

Extracto

Contribute to philschmid/gemini-samples development by creating an account on GitHub.

Resumen

Resumen Principal

Este repositorio es una colección exhaustiva de recursos prácticos diseñada para facilitar la exploración e implementación de los avanzados modelos de inteligencia artificial Google DeepMind Gemini y Gemma. Ofrece una gama diversificada de ejemplos, fragmentos de código y guías detalladas que cubren desde integraciones básicas hasta funcionalidades experimentales. Los usuarios pueden aprender a integrar Gemini con el SDK de OpenAI, habilitar la búsqueda de Google para obtener información en tiempo real, y generar salidas JSON estructuradas utilizando Pydantic y meta prompts dinámicos. Además, el repositorio explora capacidades multimodales como la transcripción de audio con marcas de tiempo precisas y el análisis de videos de YouTube, así como la generación nativa de imágenes con el modelo experimental Gemini 2.0 Flash. Para el modelo Gemma, se proporcionan ejemplos sobre su uso con el SDK de Google GenAI y la implementación de la llamada a funciones. En conjunto, estos recursos representan un punto de partida invaluable para desarrolladores y entusiastas que buscan experimentar y construir aplicaciones innovadoras con las tecnologías de IA de Google.

Elementos Clave

Capacidades Avanzadas de Gemini: El repositorio destaca la versatilidad de los modelos Gemini a través de diversas funcionalidades. Incluye ejemplos de integración con el SDK de OpenAI y la capacidad de conectar Gemini con Google Search para acceder a datos actualizados. Esto subraya su adaptabilidad para casos de uso que requieren tanto un marco de desarrollo familiar como información en tiempo real.
Generación de Salidas Estructuradas y Multimodales: Se enfatiza la habilidad de Gemini para producir salidas JSON estructuradas utilizando Pydantic, y la creación dinámica de esquemas mediante meta prompts. También se cubren funcionalidades multimodales críticas como la transcripción de audio con marcas de tiempo precisas y el análisis y transcripción de videos de YouTube, mostrando el potencial de Gemini en el procesamiento de medios complejos.
Innovación en Interacción y Creación de Contenido: El repositorio presenta una guía completa sobre la llamada a funciones (Function Calling), permitiendo a los modelos interactuar con sistemas externos. Un aspecto notable y experimental es la demostración de la generación nativa de imágenes directamente con el modelo Gemini 2.0 Flash, lo que abre nuevas fronteras para la creación de contenido

Contenido

Google DeepMind Models Samples, Snippets and Guides

This repository contains personal tiny samples, snippets and guides showcasing cool experiments and implementations using Google DeepMind Gemini models.

Examples

Gemini with OpenAI SDK - Use Gemini models with the OpenAI SDK
Gemini with Google Search - Enable Google Search integration for up-to-date information
Structured Outputs - Generate structured JSON outputs using Pydantic
Meta Prompts - Generate JSON schemas dynamically using meta prompts
Audio Transcription - Transcribe audio with precise timestamps
Gemini MCP Example - Example showcasing Model-Code Pairing (MCP)
Gemini Analyze & Transcribe YouTube - Analyze and transcribe YouTube videos
Function Calling Guide - Comprehensive guide on implementing function calling
Gemini Native Image Output - Generate images directly with Gemini 2.0 Flash experimental model

JavaScript Examples

Gemini Native Image Output - Generate images directly with Gemini 2.0 Flash experimental model

Gemma

Gemma with GenAI SDK - Use Gemma 3 27B It with Google's GenAI API
Gemma Function Calling - Implement function calling with Gemma 3 27B

Repository Structure

├── examples/
│   └── gemini-with-openai-sdk.ipynb
├── guides/
│   └── function-calling.ipynb
├── LICENSE
└── README.md

How to Use

Clone the repository:

git clone https://github.com/philschmid/gemini-samples.git

Set up environment variables: Create a .env file in the root directory:
```
GEMINI_API_KEY=your_api_key_here
```
Explore the examples: Browse the sample notebooks to find code related to different DeepMind models and experiments.
Run and modify: Experiment with the code, tweak parameters, and integrate the snippets into your own projects.

Contributing

Contributions are welcome! If you have additional examples or improvements, please feel free to open a pull request or create an issue.

License

This repository is licensed under the MIT License. See the LICENSE file for more details.