Fonctions pour travailler avec des URL 

Toutes ces fonctions ne suivent pas la RFC. Ils sont simplifiés au maximum pour améliorer les performances.

Fonctions qui extraient des parties d'une URL 

Si la partie pertinente n'est pas présente dans une URL, une chaîne vide est renvoyée.

protocole 

Extrait le protocole d'une URL.

Examples of typical returned values: http, https, ftp, mailto, tel, magnet…

domaine 

Extrait le nom d'hôte d'une URL.

domain(url)

Paramètre

L'URL peut être spécifiée avec ou sans schéma. Exemple:

svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://yandex.com/time/

Pour ces exemples, le domain la fonction renvoie les résultats suivants:

some.svn-hosting.com
some.svn-hosting.com
yandex.com

Valeurs renvoyées

  • Nom d'hôte. Si ClickHouse peut analyser la chaîne d'entrée en tant QU'URL.
  • Chaîne vide. Si ClickHouse ne peut pas analyser la chaîne d'entrée en tant QU'URL.

Type: String.

Exemple

SELECT domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')
┌─domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')─┐
│ some.svn-hosting.com                                   │
└────────────────────────────────────────────────────────┘

domainWithoutWWW 

Renvoie le domaine et ne supprime pas plus d'un ‘www.’ dès le début de celui-ci, si présent.

topLevelDomain 

Extrait le domaine de premier niveau d'une URL.

topLevelDomain(url)

Paramètre

L'URL peut être spécifiée avec ou sans schéma. Exemple:

svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://yandex.com/time/

Valeurs renvoyées

  • Nom de domaine. Si ClickHouse peut analyser la chaîne d'entrée en tant QU'URL.
  • Chaîne vide. Si ClickHouse ne peut pas analyser la chaîne d'entrée en tant QU'URL.

Type: String.

Exemple

SELECT topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')
┌─topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')─┐
│ com                                                                │
└────────────────────────────────────────────────────────────────────┘

firstSignificantSubdomain 

Renvoie la “first significant subdomain”. C'est un concept non standard spécifique à Yandex.Metrica. Le premier sous-domaine significatif est un domaine de deuxième niveau s'il est ‘com’, ‘net’, ‘org’, ou ‘co’. Sinon, il est un domaine de troisième niveau. Exemple, firstSignificantSubdomain (‘https://news.yandex.ru/’) = ‘yandex’, firstSignificantSubdomain (‘https://news.yandex.com.tr/’) = ‘yandex’. La liste des “insignificant” les domaines de deuxième niveau et d'autres détails de mise en œuvre peuvent changer à l'avenir.

cutToFirstSignificantSubdomain 

Renvoie la partie du domaine qui inclut les sous-domaines de premier niveau “first significant subdomain” (voir l'explication ci-dessus).

Exemple, cutToFirstSignificantSubdomain('https://news.yandex.com.tr/') = 'yandex.com.tr'.

chemin 

Retourne le chemin d'accès. Exemple: /top/news.html Le chemin n'inclut pas la chaîne de requête.

pathFull 

La même chose que ci-dessus, mais y compris la chaîne de requête et le fragment. Exemple: / top / nouvelles.le html?page = 2 # commentaires

queryString 

Retourne la chaîne de requête. Exemple: page = 1 & lr=213. query-string n'inclut pas le point d'interrogation initial, ainsi que # et tout ce qui suit #.

fragment 

Renvoie l'identificateur de fragment. fragment n'inclut pas le symbole de hachage initial.

queryStringAndFragment 

Renvoie la chaîne de requête et l'Identificateur de fragment. Exemple: page = 1 # 29390.

extractURLParameter (URL, nom) 

Renvoie la valeur de la ‘name’ paramètre dans l'URL, le cas échéant. Sinon, une chaîne vide. S'il y a beaucoup de paramètres avec ce nom, il renvoie la première occurrence. Cette fonction fonctionne en supposant que le nom du paramètre est codé dans L'URL exactement de la même manière que dans l'argument passé.

extractURLParameters (URL) 

Renvoie un tableau de chaînes name = value correspondant aux paramètres D'URL. Les valeurs ne sont en aucun cas décodées.

extractURLParameterNames (URL) 

Retourne un tableau de chaînes de noms correspondant aux noms des paramètres d'URL. Les valeurs ne sont en aucun cas décodées.

URLHierarchy (URL) 

Retourne un tableau contenant L'URL, tronquée à la fin par les symboles /,? dans le chemin et la chaîne de requête. Les caractères séparateurs consécutifs sont comptés comme un. La coupe est faite dans la position après tous les caractères de séparation consécutifs.

URLPathHierarchy (URL) 

La même chose que ci-dessus, mais sans le protocole et l'hôte dans le résultat. Le / les élément (racine) n'est pas inclus. Exemple: la fonction est utilisée pour implémenter l'arborescence des rapports de L'URL dans Yandex. Métrique.

URLPathHierarchy('https://example.com/browse/CONV-6788') =
[
    '/browse/',
    '/browse/CONV-6788'
]

decodeURLComponent (URL) 

Renvoie L'URL décodée.
Exemple:

SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
┌─DecodedURL─────────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1; │
└────────────────────────────────────────┘

Fonctions qui suppriment une partie D'une URL 

Si L'URL n'a rien de similaire, L'URL reste inchangée.

cutWWW 

Supprime pas plus d'une ‘www.’ depuis le début du domaine de L'URL, s'il est présent.

cutQueryString 

Supprime la chaîne de requête. Le point d'interrogation est également supprimé.

cutFragment 

Supprime l'identificateur de fragment. Le signe est également supprimé.

couperystringandfragment 

Supprime la chaîne de requête et l'Identificateur de fragment. Le point d'interrogation et le signe numérique sont également supprimés.

cutURLParameter (URL, nom) 

Supprime le ‘name’ Paramètre URL, si présent. Cette fonction fonctionne en supposant que le nom du paramètre est codé dans L'URL exactement de la même manière que dans l'argument passé.

Évaluation: 3.7 - 3 vote

Ce contenu a été utile?
★★★★☆