Apple incluyó en Xcode 26 una función que está generando mucho ruido en la comunidad de desarrolladores: la integración Intelligence admite proveedores de modelos alojados localmente. Conecta Ollama en el puerto 11434 y tu IDE dispone de asistencia de código con IA — completado de funciones, explicaciones en línea, sugerencias de refactorización — sin enviar ni una línea de código a la nube.
Anders Brownworth, investigador conocido en la comunidad de desarrollo open-source y Bitcoin, publicó recientemente en X el hallazgo: "Just learned that in Xcode's Apple Intelligence you can add a local LLM using Ollama and have private AI coding assistance without an internet connection" (fuente en X).
Para los equipos de desarrollo de empresas españolas que trabajan con código propietario o en sectores regulados, esto abre una posibilidad muy concreta: asistencia de IA en la IDE sin los riesgos de privacidad ni los costes recurrentes de las APIs en la nube.
Por qué la privacidad importa en los asistentes de código
Los asistentes de codificación en la nube más populares (GitHub Copilot, Cursor y similares) funcionan enviando fragmentos de código a servidores externos para su procesamiento. Eso plantea problemas reales para equipos profesionales:
- El código fuente es activo empresarial: puede contener algoritmos propietarios, lógica de negocio confidencial, datos de prueba sensibles o accesos a APIs internas que ninguna empresa debería exponer al exterior.
- RGPD y datos personales: los comentarios del código, los fixtures de tests o las variables de entorno pueden incluir datos personales. Transferirlos a servidores estadounidenses exige una base legal documentada y medidas para transferencias internacionales conforme a los arts. 44–49 RGPD.
- Sectores regulados: sanidad (SaMD, requisitos del RDL de software médico), fintech (PSD2, MiFID), administraciones públicas y defensa tienen requisitos explícitos de localización de datos que hacen problemático el uso de IA en la nube.
Con un LLM local via Ollama, ningún fragmento de código sale del dispositivo. Según nuestra interpretación de la normativa vigente, esto elimina la necesidad de documentación adicional para transferencias internacionales en el flujo de trabajo del asistente de codificación. Más información en nuestra sección de IA local y soberanía del dato.
Configuración paso a paso en Xcode 26
El proceso se completa en menos de 15 minutos en cualquier Mac con macOS 26.
Paso 1 — Instalar Ollama y descargar un modelo de codificación
brew install ollama
# Elige el modelo según la RAM disponible:
ollama pull deepseek-coder-v2:16b # ≥16 GB RAM — ideal para Swift, Python, TypeScript
ollama pull codellama:13b # 14–16 GB RAM — soporte amplio de lenguajes
ollama pull phi4:14b # 12–14 GB RAM — compacto, buena relación calidad/recurso
Paso 2 — Arrancar el servidor Ollama
ollama serve
# Puerto por defecto: localhost:11434
En Apple Silicon (M3/M4), Ollama utiliza desde la versión 0.19 (marzo 2026) el backend MLX de Apple, que aprovecha directamente la arquitectura de memoria unificada a través del framework Metal. Según mediciones reportadas por la comunidad de desarrolladores, la velocidad de inferencia en chips Apple Silicon mejora de forma notable respecto a versiones anteriores basadas en llama.cpp.
Paso 3 — Añadir el proveedor en Xcode 26
- Abre Xcode 26 → Settings → Intelligence
- Haz clic en Add a Model Provider
- Selecciona Locally Hosted
- Introduce el puerto
11434 - Asigna una etiqueta (p. ej., «Ollama local»)
- Confirma
Xcode detecta automáticamente todos los modelos disponibles en Ollama y los pone a disposición para completado de código, explicaciones y sugerencias de refactorización.
Qué modelo elegir según el hardware
La elección del modelo depende del hardware disponible y del tipo de tareas de desarrollo. Basándonos en la experiencia reportada por la comunidad:
| Modelo | RAM necesaria | Mejor para |
|---|---|---|
| DeepSeek-Coder-V2 (16B) | ≥16 GB | Swift, Python, TypeScript, completado |
| CodeLlama (13B) | 14–16 GB | Soporte general multi-lenguaje |
| Phi-4 (14B) | 12–14 GB | MacBook con 16 GB, buen razonamiento |
| Qwen2.5-Coder (32B) | 32–40 GB | Máxima calidad, Mac Studio 64 GB+ |
Para Swift específicamente, DeepSeek-Coder-V2 es la opción más recomendada por la comunidad de desarrolladores Apple, principalmente por su entrenamiento sobre código de frameworks de Apple y patrones típicos de Swift.
Qué rendimiento esperar
En un Mac Studio M3 Ultra (192 GB), los desarrolladores reportan un completado fluido incluso con modelos de 32B, con sugerencias que aparecen prácticamente en tiempo real. En un MacBook Pro M4 Pro (36 GB), los modelos de 16B alcanzan según mediciones reportadas por practicantes una velocidad de generación suficiente para el uso interactivo en la IDE: las sugerencias aparecen antes de terminar de escribir el siguiente identificador.
Una reflexión honesta sobre las limitaciones: los modelos locales de esta escala no sustituyen a los modelos frontal de nube en tareas complejas de arquitectura multi-fichero. Donde destacan es en el trabajo cotidiano — completar funciones, explicar errores de compilación, generar tests unitarios, escribir docstrings — que representa, para la mayoría de los equipos, el grueso de su uso de asistencia de IA. En esas tareas, la ausencia de coste por token y la privacidad completa hacen una diferencia real.
Despliegue en equipo: un servidor para varias instancias de Xcode
En lugar de instalar Ollama en el ordenador de cada desarrollador, un Mac Studio puede actuar como servidor de inferencia centralizado en red local. Cada instancia de Xcode apunta al mismo endpoint — en la configuración de Xcode, sustituye localhost por la IP LAN del servidor.
Detalles prácticos para el despliegue en equipo:
- Gestión de modelos:
ollama listmuestra los modelos descargados;ollama rm <modelo>libera espacio en disco. Los archivos de modelo se almacenan en~/.ollama/models/. - Concurrencia: Un Mac Studio M3 Ultra (192 GB) gestiona varias sesiones de Xcode simultáneas sin degradación apreciable.
- Ventana de contexto: La mayoría de los modelos de 13B–16B tienen ventanas de 8k–32k tokens. Para archivos muy grandes, Xcode envía el contexto por ventanas, por lo que los archivos extensos se procesan de forma parcial.
Kit Digital y pymes españolas: ¿encaja esta solución?
Las empresas españolas con equipos de desarrollo propios o que subcontratan desarrollo de software pueden explorar si la implantación de infraestructura de IA local encaja en las convocatorias del programa Kit Digital.
Las categorías «Gestión de procesos» y «Business Intelligence & Analítica» del Kit Digital pueden admitir soluciones que optimicen la productividad del equipo técnico mediante herramientas de IA integradas en los flujos de trabajo de desarrollo, siempre que exista un agente digitalizador acreditado que acompañe la implantación. Según nuestra interpretación de las bases del programa, cada solicitud debe valorarse de forma individual en función de la convocatoria vigente, el tamaño de la empresa y el alcance de la solución.
Más información sobre cómo combinar la subvención con soluciones de IA local en nuestra sección Kit Digital.
IA local para sectores con requisitos de privacidad
Tres sectores donde este tipo de despliegue tiene un valor claro:
Desarrolladores de software médico bajo requisitos del Reglamento de Productos Sanitarios (RGPS/MDR) necesitan documentar las herramientas de desarrollo utilizadas. Un asistente de IA local sin enrutamiento externo de datos es considerablemente más sencillo de documentar que una API en la nube con términos de servicio sujetos a cambios.
Equipos fintech sujetos a PSD2 o regulación del Banco de España se benefician de la localización clara de los datos: el código nunca sale del perímetro de la red corporativa, independientemente de qué asistencia de IA esté activa.
Proveedores de software para administración pública pueden presentar el uso de inferencia local como argumento concreto en los procesos de evaluación de seguridad y protección de datos exigidos por la normativa de contratación pública.
Implanta IA local en tu equipo con Freshlab
Si tu empresa está evaluando una infraestructura de IA local — selección de hardware, configuración de modelos, arquitectura de red, o documentación para auditorías de soberanía del dato — te acompañamos en cada etapa.
Explora nuestras soluciones de IA local o contáctanos para hablar de tu caso concreto.