Saltar al contenido

OpenClaw en Windows: el nodo que deja a la IA controlar tu PC

Captura del OpenClaw Windows Hub mostrando el estado del gateway local y el nodo de Windows IRONHEART3 en línea

Escrito por

en

,

OpenClaw en Windows: el nodo que deja a la IA controlar tu PC

TL;DR: openclaw-windows-node es la suite nativa de Windows para OpenClaw, el asistente personal de IA de código abierto creado por Peter Steinberger. Combina una app de bandeja del sistema en WinUI 3 con un Node Mode que convierte tu PC en un nodo que el agente puede operar: tomar capturas, ejecutar comandos, usar la cámara o renderizar un canvas. Todo bajo allowlists explícitas y arquitectura local-first. Usa WebView2 y .NET 10, pero no es un producto oficial de Microsoft, pese a que lo co-creó Scott Hanselman.

¿Qué es OpenClaw y por qué tiene un nodo de Windows?

OpenClaw es un asistente personal de IA que corre en tus propios dispositivos en lugar de en una nube de terceros. Su mascota es una langosta llamada Molty (de ahí el 🦞), y su gran propuesta es ser local-first: tú decides qué modelo de lenguaje procesa la información, ya sea uno local vía Ollama o tus propias claves de API de proveedores como Claude, OpenAI o DeepSeek.

El proyecto nació en noviembre de 2025 y cambió de nombre dos veces en pocas semanas: empezó como Clawd —nombre inspirado en Claude de Anthropic—, pasó a Moltbot tras quejas de marca de Anthropic, y terminó como OpenClaw. El motor principal acumula más de 247.000 estrellas en GitHub, una de las cifras más altas del ecosistema de agentes de IA.

El repositorio openclaw-windows-node es una pieza distinta: la suite complementaria nativa para Windows. Tiene un alcance mucho más acotado (alrededor de 1.000 estrellas y 141 forks) y su única misión es tender un puente entre el escritorio de Windows y el motor de OpenClaw. Conviene no confundir las dos cifras: las 247.000 estrellas son del ecosistema completo, no de este componente.

¿Qué contiene el repositorio?

Es un monorepo en C# (≈94 % del código) organizado en componentes con responsabilidades separadas:

  • OpenClaw.Tray.WinUI — la aplicación de bandeja del sistema, construida con WinUI 3.
  • OpenClaw.Shared — la librería cliente que habla con el gateway de OpenClaw.
  • OpenClaw.Cli — un validador de línea de comandos para probar la conexión WebSocket (connect/send/probe) usando la configuración de la bandeja.
  • OpenClaw.CommandPalette — una extensión para la Command Palette de PowerToys, para lanzar acciones de OpenClaw desde el lanzador de Windows.

La comunicación con el motor ocurre de forma local: el cliente se conecta al gateway por WebSocket en ws://localhost:18789, y la configuración de la bandeja vive en %APPDATA%\OpenClawTray\settings.json. Nada de esto sale a una nube pública: el puente es estrictamente local.

¿Qué hace la app de bandeja del sistema?

La app de bandeja es la cara visible de la integración. Reside junto al reloj de Windows y ofrece:

  • Quick Send con atajo global Ctrl+Alt+Shift+C para mandar un mensaje al agente sin abrir nada.
  • Notificaciones toast clicables de Windows, con categorización inteligente.
  • Ventana de chat embebida mediante WebView2, así no necesitas el navegador.
  • Command Center: un panel de diagnóstico con salud de canales, uso, sesiones y nodos.
  • Control de canales como Telegram y WhatsApp directamente desde el menú.
  • Deep links con el esquema openclaw:// (por ejemplo openclaw://chat, openclaw://settings o openclaw://send?message=Hola) para automatizar la navegación.

El primer arranque te guía con un asistente de seis pasos: bienvenida, conexión, configuración, permisos, chat y listo.

¿Qué es el Node Mode y por qué es lo más potente?

El Node Mode es la característica diferencial. Al activarlo en Ajustes, tu PC con Windows se convierte en un nodo que el agente de OpenClaw puede operar —igual que ya hacía la app de Mac—. El agente deja de solo conversar y empieza a actuar sobre el escritorio.

Las capacidades se agrupan por categorías de comando:

Categoría Comandos representativos Para qué sirve
Sistema system.notify, system.run, system.which Notificar y ejecutar comandos de terminal
Canvas canvas.present, canvas.navigate, canvas.eval, canvas.snapshot Mostrar y controlar una interfaz web; evaluar JavaScript
Pantalla screen.snapshot, screen.record Captura de pantalla y grabación MP4 de duración fija
Cámara camera.list, camera.snap, camera.clip Enumerar cámaras, tomar foto o clip
Voz stt.transcribe (opt-in) Transcripción de voz a texto
Ubicación location.get Geolocalización (requiere permiso de Windows)
Dispositivo device.info, device.status Estado del equipo
TTS tts.speak Síntesis de voz (Windows o ElevenLabs)

En la práctica, esto permite que la IA tome una captura para entender qué tienes en pantalla, ejecute un comando que le pediste o te lea un resultado en voz alta, todo de forma autónoma —dentro de los límites que tú definas—.

¿Cómo se controla la seguridad? El modelo de allowlists

Aquí está el detalle que hace que el Node Mode sea usable sin pánico: nada se ejecuta sin autorización explícita. La filosofía es de lista blanca, no de lista negra.

Para habilitar comandos, hay que listarlos uno a uno en el gateway, dentro de ~/.openclaw/openclaw.json:

{
  "gateway": {
    "nodes": {
      "allowCommands": [
        "system.notify",
        "screen.snapshot",
        "canvas.present"
      ]
    }
  }
}

Un detalle importante: los comodines no funcionan. Escribir canvas.* no habilita toda la familia; cada comando debe figurar de forma individual. Es una decisión de diseño deliberada para evitar conceder permisos de más por descuido.

Además, el dispositivo debe aprobarse explícitamente antes de operar como nodo:

openclaw devices approve <id>

Y para system.run existe una capa extra: una política de ejecución local en %LOCALAPPDATA%\OpenClawTray\exec-policy.json que filtra comandos por patrón. Variables de entorno peligrosas como PATH, NODE_OPTIONS o LD_* se rechazan de plano. Para que la cámara y el micrófono pidan consentimiento del sistema, la app se empaqueta como MSIX (-p:PackageMsix=true).

¿Qué necesitas para compilarlo?

Los requisitos son explícitos y modernos:

  • .NET 10 SDK (requisito estricto en la versión actual).
  • Windows 10 (20H2+) o Windows 11.
  • WebView2 Runtime —ya viene preinstalado en Windows modernos—.
  • Windows 10 SDK para compilar la parte de WinUI.

Hay instaladores precompilados para x64 y ARM64, o puedes compilar desde el código con el script build.ps1:

.\build.ps1 -Runtime win-x64

¿Es un proyecto oficial de Microsoft?

No. Y conviene dejarlo claro porque la confusión es razonable. El repositorio pertenece a la organización independiente openclaw, se distribuye bajo licencia MIT y lo impulsa la comunidad de código abierto.

La confusión tiene dos orígenes legítimos:

  1. Scott Hanselman, figura muy conocida de Microsoft, co-creó este nodo de Windows (la portada del repo dice literalmente «Made with 🦞 love by Scott Hanselman and Molty»). Pero su participación es a título personal, como impulsor del ecosistema abierto, no como un lanzamiento corporativo.
  2. La pila tecnológica es 100 % del ecosistema Microsoft: WinUI 3, WebView2 y .NET 10, optimizado para Windows 11 en x64 y ARM64. Eso refuerza la sensación de «producto Microsoft» sin serlo.

¿Y si necesito una alternativa con respaldo comercial?

Si tu organización exige herramientas soportadas oficialmente por Microsoft (por cumplimiento o soporte), el panorama cambia:

  • Microsoft Copilot (integrado en Windows): la opción oficial a nivel de sistema operativo. Hace búsquedas, redacción y ajustes básicos de configuración de forma segura, pero con mucha menos autonomía de escritorio que OpenClaw.
  • Microsoft 365 Copilot: orientado a flujos de trabajo empresariales. Mientras OpenClaw automatiza simulando la interfaz o leyendo la pantalla, M365 Copilot se integra por APIs internas de Word, Excel o Teams, con más fiabilidad para generar documentos estructurados.
  • Eigent AI: una arquitectura autohospedada de espíritu similar a OpenClaw, pero orientada al cumplimiento normativo empresarial y a la integración con herramientas corporativas.

Conclusión

openclaw-windows-node es uno de los ejemplos más claros de hacia dónde van los agentes de IA en el escritorio: no un chatbot encerrado en una ventana, sino un asistente que observa la pantalla, ejecuta comandos y actúa, manteniendo el control en manos del usuario gracias a un modelo de allowlists y ejecución local-first. Que use toda la pila moderna de Windows (WinUI 3, WebView2, .NET 10) lo hace sentir oficial, pero es un proyecto comunitario MIT con la participación personal de Scott Hanselman.

Si te interesa el lado económico de conectar estos agentes a modelos de lenguaje —porque OpenClaw te deja elegir el LLM—, te puede servir nuestra comparativa de precios de las API de IA en 2026 para decidir entre un modelo local con Ollama o una API externa.

Fuente principal: openclaw/openclaw-windows-node en GitHub · Descargar .NET 10 SDK

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *