En resumen: Las expresiones regulares (RegEx) son patrones de búsqueda que permiten filtrar y segmentar datos en Google Search Console y Google Analytics 4. En SEO sirven para separar tráfico de marca, identificar long tails, agrupar URLs por sección sin subcarpetas y analizar tipologías de página. GSC usa coincidencia parcial; GA4 usa coincidencia completa y tiene un límite de 4096 caracteres por filtro en GSC.
Si trabajas en SEO y todavía no has incorporado las expresiones regulares a tu trabajo, estás dejando de lado una de las herramientas con mayor potencial para el análisis de datos. Google Search Console y Google Analytics 4 permiten filtrar datos con RegEx, y saber aprovecharlo marca una gran diferencia a la hora de entender cómo rinde un proyecto web y tomar decisiones estratégicas en base a datos. En este artículo te explicamos qué son, cómo funcionan y, sobre todo, cómo sacarles partido con casos de uso prácticos y directamente aplicables.
Qué son las expresiones regulares y por qué importan en SEO
Una expresión regular (o RegEx, del inglés Regular Expression) es una secuencia de caracteres que define un patrón de búsqueda. Dicho de otra forma: es una forma de decirle a una herramienta “quiero todo lo que cumpla estas condiciones”, sin tener que escribir o buscar cada caso uno por uno.
Las RegEx no son algo nuevo. Se utilizan en programación desde hace décadas, en lenguajes como Python, JavaScript o PHP, para buscar, extraer y transformar texto. Pero en su aplicación en SEO, concretamente en herramientas de análisis como GSC y GA4, es donde más valor aportan para el día a día de un consultor o un analista.
¿Por qué son tan útiles en SEO? Porque los proyectos web generan grandes volúmenes de datos: miles de URLs, decenas de miles de consultas orgánicas, millones de sesiones… Sin filtros avanzados, analizar esos datos es como buscar una aguja en un pajar. Las expresiones regulares te permiten definir patrones precisos para segmentar, filtrar y agrupar información de forma que ningún filtro estándar puede gestionar.
Algunos ejemplos de lo que puedes hacer:
- Filtrar todas las URLs de una sección específica del sitio (aunque no tengan una subcarpeta clara).
- Filtrar las consultas de búsqueda que son de marca vs. las que no lo son.
- Identificar keywords con intención informativa, transaccional o de comparativa.
- Segmentar el tráfico en GA4 por tipología de página (ficha de producto, categoría, entrada de blog…).
Las bases mínimas que necesitas conocer
No hace falta ser programador para usar RegEx en SEO. Con dominar algunos operadores básicos ya puedes construir filtros muy potentes. Aquí tienes algunas de las reglas más esenciales:
Comodines
| Símbolo | Significado | Ejemplo Regex | Ejemplo coincidencia |
|---|---|---|---|
. | Cualquier carácter | a.b | ”acb”, “a1b” |
* | El elemento anterior, 0 o más veces | ca*sa | ”csa”, “casa”, “caasa” |
+ | El elemento anterior, 1 o más veces | ca+sa | ”casa”, “caasa” (no “csa”) |
? | El elemento anterior, 0 o 1 vez | colou?r | ”color” o “colour” |
| | OR lógico - Cualquiera de los términos | gato|perro | ”gato” o “perro” |
Anclas
| Símbolo | Significado | Ejemplo Regex | Ejemplo coincidencia |
|---|---|---|---|
^ | Inicio de cadena | ^/blog | URLs que empiezan por /blog |
$ | Fin de cadena | \.html$ | URLs que terminan en .html |
Grupos
| Símbolo | Significado | Ejemplo Regex | Ejemplo coincidencia |
|---|---|---|---|
[ ] | Cualquiera de los caracteres del grupo | [0-9] | cualquier dígito |
() | Agrupación | (gato|perro)s | ”gatos” o “perros” |
Escapar
| Símbolo | Significado | Ejemplo Regex |
|---|---|---|
\ | El carácter adyacente debe interpretarse literalmente | \. indica que el punto debe interpretarse como un punto o decimal en lugar de un comodín. |
Otros operadores útiles
{n,m}: repetición entre n y m veces. Ejemplo:{5,10}permite cadenas de entre 5 y 10 caracteres.\d: dígito numérico. Ejemplo:\d+captura uno o más números.\w: carácter alfanumérico o guión bajo. Ejemplo:\w+captura una o más palabras.
Con estos bloques y un poco de imaginación ya puedes construir la gran mayoría de filtros útiles para SEO.
La IA como aliado para construir expresiones regulares
Hoy en día, la IA es una herramienta extraordinaria para generar expresiones regulares. Puedes describir en lenguaje natural lo que quieres filtrar y obtener el RegEx correspondiente en segundos.
Sin embargo, aquí está la clave diferencial: no basta con copiar y pegar lo que la IA te da. Es fundamental tener un conocimiento mínimo de RegEx para poder revisar la expresión, detectar si tiene errores, y sobre todo, para saber indicarle bien a la IA lo que necesitas. Una instrucción vaga produce un RegEx vago. Saber qué quieres con precisión, y saber verificar que lo que te devuelven es correcto, es la diferencia entre obtener resultados correctos o erróneos.
RegEx en Google Search Console
Google Search Console permite aplicar RegEx en dos contextos principales dentro del informe de rendimiento: en el filtro de Páginas (URLs) y en el filtro de Consultas (keywords). El acceso es el mismo en ambos casos: en el apartado de filtros, haz clic en ”+ Añadir filtro”, selecciona “Páginas” o “Consultas” y elige la opción “Personalizada (regex)”.




Filtrado de páginas y URLs
Este es uno de los usos más potentes y menos explotados de RegEx en GSC. Los proyectos bien estructurados tienen subcarpetas claras (/blog/, /productos/, /categoria/), pero la realidad es que muchos sitios no siguen una estructura limpia, y ahí es donde las expresiones regulares nos permiten segmentar pese a no tener estructuras marcadas y solventar las limitaciones de los filtros simples (“coincide con” y “no coincide con”).
A continuación presentamos algunos de los usos más frecuentes y útiles:
Filtrar múltiples secciones a la vez:
En muchas ocasiones la segmentación de una sola subcarpeta no es suficiente y queremos analizar varias subcarpetas al mismo tiempo. Para ello podemos usar la siguiente RegEx:
/blog|/noticias|/guias
Muestra únicamente URLs que pertenecen a alguna de esas tres secciones.
Identificar páginas de producto sin subcarpeta clara:
Este es un caso muy habitual en ecommerce. Muchas tiendas online tienen URLs de producto del tipo /nombre-del-producto-azul-talla-m-ref123, sin una subcarpeta /producto/ o similar. En estos casos, podemos usar características comunes de esas URLs para aislarlas.
Una técnica muy útil es filtrar por la longitud de la URL, ya que las fichas de producto suelen tener URLs considerablemente más largas que las categorías o la home. Por ejemplo, para mostrar URLs con más de 50 caracteres:
^.{51,}$
Cambiando el número podremos filtrar entre URL’s más cortas o más largas.
Otro caso común en la construcción de URLs de producto es el uso de IDs, incluyendo números en la URL. Usando el ejemplo anterior (/nombre-del-producto-azul-talla-m-ref123) podemos filtrar las URLs que contienen números con la siguiente regex:
[0-9]
Otra regex equivalente, como hemos visto al inicio del artículo, sería la siguiente:
\d
Encontrar URLs por profundidad de subcarpetas:
^https?://[^/]+(/[^/]+){X,}
En otros casos podemos tener la necesidad de encontrar URLs profundas o con un número concreto de subcarpetas. En esta RegEx de ejemplo podemos encontrar URLs de la profundidad que deseemos, sustituyendo la X por el número mínimo de profundidad deseado. Por ejemplo:
^https?://[^/]+(/[^/]+){2,}
Con esta RegEx encontraríamos URLs con una profundidad igual o mayor a dos subcarpetas.
Filtrado de consultas (keywords)
El análisis de consultas con RegEx también podemos encontrar aplicaciones con gran potencial para el análisis SEO. A continuación destacamos las más habituales para todo tipo de proyectos:
Filtrar consultas de marca:
Este es uno de los análisis más importantes en SEO: separar el tráfico branded del non-branded es fundamental para evaluar el verdadero impacto del posicionamiento orgánico.
Sin embargo en muchas ocasiones las variantes de escritura de nuestra marca nos pueden dificultar esta división a través de los filtros simples. Con la siguiente implementación podremos de manera sencilla filtrar todas las variantes de nuestra marca:
variante1|variante2|variante3
Si analizamos el caso de SEOCOM.Agency podríamos aplicar la siguiente RegEx en función de sus variables de búsqueda:
seocom|seo com|seocom.agency|seocomagency
Encontrar keywords long tail:
Las consultas long tail suelen tener 4 o más palabras. Podemos aproximarlo contando espacios:
(\w+ ){3,}\w+
Cambiando el número dentro del al regex podremos ajustar a nuestro gusto este filtro.
Identificar intención informativa:
^(qué|que|cómo|como|cuando|cuándo|cuál|cual|por qué|por que|dónde|donde|cuánto|cuanto)
Este filtro recoge las consultas que empiezan con palabras interrogativas, las más representativas de intención informativa. Es perfecto para identificar oportunidades de contenido o para medir el rendimiento del blog vs. las páginas transaccionales.
Detectar atributos de precio o comparativa:
barato|económico|precio|coste|oferta|descuento|mejor|comparativa|vs|alternativa
Captura consultas donde el usuario está buscando información de compra comparada o con sensibilidad al precio. Muy útil para ecommerce o para identificar oportunidades de contenido de tipo “el mejor X para Y”.
En este aspecto se trata de una RegEx sencilla y muy fácilmente modificable por lo que la podemos variar con los atributos que consideremos necesarios.
Filtrar por sector o categoría temática:
Otro uso muy sencillo es para agrupar consultas por temáticas, algo muy útil cuando queremos analizar un clúster temático concreto o queremos analizar posibles canibalizaciones.
Su construcción es la misma que hemos visto con anterioridad haciendo uso del carácter |.
Por ejemplo si queremos analizar concretamente la temática relacionada con “posicionamiento seo”:
seo|orgánico|google|posicionamiento
Identificar consultas con números o años:
\d{4}
Muy útil para detectar búsquedas con año (guías, rankings, comparativas actualizadas) y saber si tu contenido está optimizado para esa temporalidad.
Potencial de las RegEx en GSC
Las expresiones regulares en Google Search Console transforman una herramienta que muchos usan de forma superficial en un auténtico sistema de análisis avanzado. La clave es pensar en patrones: qué tienen en común las URLs o consultas que te interesan, y cómo expresarlo de forma que el filtro lo entienda. Con práctica, construir estos filtros se convierte en algo natural, y los insights que generan pueden cambiar completamente la lectura de un proyecto.
RegEx en Google Analytics 4
GA4 permite usar expresiones regulares en segmentos, audiencias, exploraciones y filtros de informes. Y si en GSC las RegEx sirven principalmente para analizar datos de rendimiento orgánico, en GA4 el campo de aplicación se amplía a todo el comportamiento de los usuarios.
Diferencias entre RegEx en GSC y GA4
Aunque ambas herramientas aceptan expresiones regulares, su comportamiento es diferente. Conocer estas diferencias evita errores frecuentes al portar filtros entre ellas.
| Aspecto | Google Search Console | Google Analytics 4 |
|---|---|---|
| Tipo de coincidencia por defecto | Parcial | Completa |
Necesita .* para que ^algo funcione | No | Sí (^algo.*) |
| Sensible a mayúsculas/minúsculas | Sí (por defecto) | Sí (por defecto) |
| Límite de caracteres por filtro | 4096 caracteres | Sin límite documentado |
| Sintaxis | RE2 (Google) | RE2 (Google) |
| Aplicación principal | Filtrar páginas y consultas | Segmentos, audiencias, exploraciones, eventos |
Una RegEx que funciona en GSC suele necesitar adaptación al pasarla a GA4. El error más común es escribir ^/blog en GA4 esperando coincidencia parcial: hay que escribir ^/blog.* para que devuelva resultados.
Dónde aplicar RegEx en GA4
Los principales puntos de entrada son:
- Exploraciones
- Reportes estándar
- Segmentos y audiencias
- Exclusiones de referral
- Filtros de tráfico interno y desarrolladores
- Canales personalizados
- Grupos de contenido
Segmentación por temática y tipología de página
Esta es, con diferencia, la aplicación más valiosa de RegEx en GA4 para el SEO. Un proyecto web no es un bloque monolítico: tiene secciones con propósitos distintos, audiencias distintas y comportamientos distintos. Analizar todo en conjunto distorsiona la realidad.
La segmentación bien hecha te permite responder preguntas como:
- ¿Qué tipología de página genera más conversiones?
- ¿Cuál es la retención del tráfico en el blog?
- ¿Cómo se comportan los usuarios que llegan primero a una categoría vs. los que llegan a un producto directamente?
Segmentación por tipologías de página
Como hemos visto con anterioridad, las RegEx son de gran utilidad para conseguir segmentar sitios web que no tienen estructuras segmentadas por subcarpetas. Para el análisis SEO es esencial diferenciar las diferentes tipologías de páginas, siendo clave en tipologías de webs como los e-commerce (categorías, productos, blog, landings…).
Para poder segmentar las diferentes tipologías de página de nuestra web sin subcarpetas debemos encontrar patrones comunes para cada tipología, que sean excluyentes del resto:
- Largo de la URL:
^https?://[^/]+(/[^/]+){2,} - Presencia de números:
\d - Contiene ciertas palabras:
palabra1|palabra2|palabra3 - Longitud por caracteres:
^.{51,}$
Segmentación por secciones temáticas
La segmentación por temática es igualmente crítica. El rendimiento por temáticas nos entrega una información clave para entender cómo Google entiende y prioriza nuestra web. Este tipo de análisis nos da información clave para saber en qué segmentos tenemos mayor potencial y en cuáles tenemos que realizar un trabajo extra para ganar autoridad y relevancia.
Al igual que en la segmentación por tipologías el problema viene cuando no tenemos una estructura por subcarpetas que identifique las temáticas. En este caso la segmentación por RegEx suele orientarse a la localización de palabras comunes por temática, dado que la construcción de la URL no suele ser un factor común y diferenciador.
En este aspecto la tipología de RegEx que nos será más útil es la siguiente:
palabra1|palabra2|palabra3
Esta es la base que más utilizaremos y que podremos combinar con otros comandos para ser más específicos o segmentar secciones concretas, como por ejemplo, si queremos segmentar las temáticas dentro del blog:
^/blog/(tecnologia|marketing|seo|redes-sociales)
Combinar segmentos con fuentes y métricas
Sin duda lo que nos da un gran potencial para las RegEx en GA4 es la gran cantidad de métricas y filtros que podemos combinar para hacer nuestros análisis más precisos.
En este aspecto la recomendación principal a nivel SEO es siempre filtrar por el canal de tráfico orgánico. Una vez combinamos nuestras RegEx de segmentación con la fuente orgánica podemos entrar a analizar muchas cuestiones del rendimiento y del comportamiento del usuario en nuestra web.
- Segmentos con mayor tráfico
- Segmentos con mayor conversión
- Ratios de rendimiento y conversión por páginas
- Tiempo medio de interacción del usuario por segmento
Preguntas frecuentes sobre RegEx en SEO
¿GSC y GA4 usan el mismo tipo de RegEx?
Ambas herramientas usan la sintaxis RE2 de Google, pero con un comportamiento por defecto distinto. GSC aplica coincidencia parcial automáticamente: /blog encuentra cualquier URL que contenga /blog. GA4 aplica coincidencia completa: para el mismo resultado hay que escribir .*\/blog.*. Esta es la causa más frecuente de RegEx que funcionan en una herramienta y no en la otra.
¿Cuál es el límite de caracteres de RegEx en Google Search Console?
GSC tiene un límite de 4096 caracteres por filtro RegEx. Si necesitas filtrar muchas variantes (por ejemplo, 200+ marcas), conviene compactar el patrón usando grupos (opcion1|opcion2|opcion3) en lugar de listas separadas. GA4 no tiene un límite tan documentado, pero por rendimiento se recomienda mantener los patrones simples.
¿Necesito saber programar para usar RegEx en SEO?
No. Para los casos de uso habituales en SEO (filtrar URLs, separar marca de no-marca, identificar intención) basta con dominar 6-8 operadores básicos: ^, $, ., *, +, ?, | y []. Con eso cubres el 90% de los filtros que vas a necesitar en GSC y GA4.
¿Por qué mi RegEx funciona en GSC pero no en GA4?
La causa más habitual es la diferencia de coincidencia parcial vs completa. Si tu RegEx empieza con ^ o termina con $, en GSC funciona porque hay coincidencia parcial implícita; en GA4 necesitas añadir .* para extender el patrón. Otra causa frecuente es el escape de caracteres especiales: en GA4 el punto . debe ir como \. cuando se usa como literal.
¿Puede la IA reemplazar el conocimiento de RegEx?
La IA acelera la creación de RegEx, pero no sustituye el criterio. Una instrucción imprecisa genera una RegEx imprecisa, y sin conocimientos básicos no puedes detectar si lo que devuelve es correcto o si tiene errores sutiles que solo se manifiestan en casos extremos. La combinación funciona: la IA construye el patrón, tú verificas que cumple el caso de uso real.
¿Hay herramientas para validar RegEx antes de aplicarlas?
Sí. Regex101 permite probar patrones contra cadenas de prueba en tiempo real y explica cada parte del patrón. RegExr es una alternativa con visualización gráfica. Ambas son gratuitas y muy útiles antes de aplicar una RegEx en GSC o GA4 sobre datos reales.
Conclusión
Las expresiones regulares son una de esas herramientas que, una vez que empiezas a usarlas, no puedes concebir el análisis SEO sin ellas. No se trata de memorizar sintaxis: se trata de desarrollar la capacidad de pensar en patrones y trasladarlos a un lenguaje que las herramientas entiendan.
Con la IA disponible hoy, la barrera técnica es mínima. Pero el conocimiento conceptual, saber qué quieres medir, cómo estructurar el patrón y cómo validar que el resultado es correcto, sigue siendo 100% humano. Y esa combinación de criterio analítico y eficiencia tecnológica es exactamente lo que diferencia un análisis SEO superficial de uno realmente accionable.
Empieza por los casos de uso más simples en GSC, ve ganando confianza y después da el salto a GA4. En poco tiempo habrás integrado las RegEx en tu flujo de trabajo habitual y tus análisis habrán ganado una calidad que impactará directamente sobre el rendimiento de tus estrategias.