JavaScript 正则应用详解【模式、欲查、反向引用等】

(编辑:jimmy 日期: 2024/11/18 浏览:2)

本文实例讲述了JavaScript 正则应用。分享给大家供大家参考,具体如下:

正则应用

正则表达式在web开发中的常用

邮箱验证
用户名验证
替换字符串某一部分
信息采集,用来分析有效代码段
...

有规律的字符串描述

正则表达式是一门独立的知识,同样的一段描述,比如,对于email的匹配表达式,在不同的语言是一样的,但是调用的函数不同。

正则表达式--规则表达式

正则表达式:正则表达式
正则表达式语法:正则表达式语法
正则表达式语言:正则表达式语言

准备性的工作

在js中,如何写正则表达式。 /RegExp/

在js里,用正则表达式来验证字符串是否满足, 使用 reg.test(str);

用正则表达式的exec函数,用来查找匹配的选项,并把查找的值取出。

reg.test(str); 返回true 或者false 。 常在表单验证中使用。

<from action="xxx.php" id="biaodan">
 <p>请输入姓名:<input type="text" id="name" /></p> 
 <p>请输入年龄:<input type="text" id="age" /></p>
 <p><input type="submit" /></p>
</from> 
<script>
 var oBD = document.getElementById('biaodan');
 var oName = document.getElementById('name');
 var oAge = document.getElementById('age');
//表单试图提交的时候,触发onsubmit事件
//这个函数返回了false,表单不会被提交 
 oBD.onclick = function(){
  //验证name
  if( !/^[\u4e00-\u9fa5]{2,4}$/.test(oName.value) ) return false; 
  //验证年龄
  if( !/^\d{2,3}$/.test(oAge.value) ) return false;
  if( parseInt( oAge.value )<10 || parseInt( oAge.value )>104 ) alert('您输入的年龄不在范围') return 
false;
  return true;
 }
</script>

exec(); 返回 数组 或 null。
exec是英语execute的意思,CEO首席执行官,E就是executive执行的
“执行” 把正则式放到字符串上执行
每次执行结果按序输出,不管结果有几个,一次只输出一个 ,如果多次输出,会保持前面的引用。当匹配超过原字符串的时候,会返回null。然后遇到null,指针返回到匹配的字符的第一位。 具有迭代器的感觉。

var str = 'ABCDEFG1234567abcdefg';
var reg = /[a-z]/g;
console.log( a=/[a-z]/g.exec(str) );
var a;
while( a=reg.exec(str) ){ //这边 null 为 fasle。 exec() 会保持对前面一次的引用。 需要使用 值来赋值。
 console.log( a );
}

使用exec() 找最大子串

var str = 'AAABBBCCCCCCC';
var reg = /(\w)\1+/g;
var maxLength = 0;
var maxLetter = '';
var a;
while( a=reg.exec(str) ){
 if( a[0].length>maxLength ){
  maxLength = a[0].length;
  maxLetter = a[0];
 }
}
console.log( maxLetter );

JavaScript 正则应用详解【模式、欲查、反向引用等】

var str='BCDEFG1234567abcdefg';
var reg = /[a-z]/g;
var a;
while( (a=reg.exec(str)) != null ){ //先赋值给a,然后再与后边判断。
 console.log( a );
}

JavaScript 正则应用详解【模式、欲查、反向引用等】

str.match( reg ); //查找,匹配到,返回数组
str.split( reg ); //拆分,返回数组
str.serch( reg ); //查找位置
str.replace( reg,'new str'); //正则替换,返回string

 
//测试是否含有hi
var reg = /hi/; //仅看字符串是否有 hi
console.log( reg.test('hello') ); //fasle
console.log( reg.test('this is iqianduan') ); //true
//测试单词 hi
var reg01 = /\bhi\b/;
console.log( reg01.test('this is') ); //false
console.log( reg01.test('this is, hi,his') );//true

正则表达式 3 句话

要找什么字符?
从哪儿找?
找几个?

要找什么字符

字面值, ‘hi' ,就是找‘hi'。

用字符的集合来表示 , [abcd], 指匹配abcd中任意一个

//找不吉利的数字
//3,4,7
var reg = /[3,4,7]/; //字符集合, 不能使用 /347/ 字面值表示,是表示整体。 
console.log( reg.test('12121212') );//false
console.log( reg.test('12341234') ); //true 

用范围表示字符 , [0-9] [0123456789] [a-z] [A-Z]

// var reg = /[0123456789]/;
var reg = /[0-9]/;
console.log( reg.test('123afsdf') ); //true
console.log( reg.test('asdf') ); //false
//是否有大写字母
var reg = /[A-Z]/;
console.log( reg.test('asdf') );//false
console.log( reg.test('Tomorrow is another day') ); //true 

字符簇, 花团锦簇-> 一坨字符。

系统为常用的字符集合,创建的简写.
例如:

  • [0-9] --> \d

  • [0-9a-zA-Z_] --> \w .. 域名,注册用户名常用的模式.

  • [\t\v\f\r\n] --> \s 空白符.

//是否含有数字
var reg = /\d/;
console.log( reg.test('123afsdf') ); //true
console.log( reg.test('asdf') ); //false

补集的形式来表示字符集合 在集合前面使用表示补集。

  • [0-9]---> [^0-9] ^ 脱字符号: 念法: caret。['kær"htmlcode">

    // 匹配单词hi,包括hi本身
    // var reg = /\bhi.+/;//错误
    // var reg = /\bhi\w+/; //错误。 + --> 至少有 一个
    var reg = /\bhi\w*/; 
    console.log( reg.exec('this is') ); //null
    console.log( reg.exec('his') ); //["his", index: 0, input: "his"]
    console.log( reg.exec('history') ); //["history", index: 0, input: "history,hi"]
    

    //匹配进行时的结尾
    var reg = /\b[a-zA-Z]+ing\b/;
    console.log( reg.exec('going') );//["going", index: 0, input: "going"]
    console.log( reg.exec('1ting.com') );//null
    console.log( reg.exec('ing') );//null //2 -> to 4->for 0->zero 
    

    //匹配un前缀的反义词
    //unhappy happy,hungry,sun,unhappy
    var reg = /\bun[\w]+\b/;
    console.log( reg.exec('happy,hungry,sun,unhappy') ); //["unhappy", index: 17, input: "happy,hungry,sun
    ,unhappy"]
    

    B 单词的非边界

    // 把单词中间的某一个部分取出来。
      // 把中间含有hi的单词取出,即hi不能在两端。
    var reg = /\Bhi\B/;
    console.log( reg.exec('this') ); //["hi", index: 1, input: "this"]
    console.log( reg.exec('hi') ); //null
    

    ^ creat , 从字符串的起始位置开始匹配

    $ 匹配到字符串的结束位置

    从字符串的开头到结尾开始匹配,模拟运行顺序.

    var reg = /^lishi$/;  
    console.log( reg.exec('lishinihao') ); null
    console.log( reg.exec('lishi') ); //["lisi", index: 0, input: "lisi"]
    

    找多少

    *, [0,n] --> {0, }
    + , [1,n] -->{1, }
    "htmlcode">

    //查找所有中间含有hi的单词
    var reg = /\Bhi\B/gi;
    var str = 'shit,hi,this,thit,THIS';
    console.log( str.match(reg) ); //["hi", "hi", "hi", "HI"]
    

    确定边界是什么,那些东西必须有,那些东西可能有可能没有。配合+,*

    //把链接换成 #
    //<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" ></a> --> <a href="#" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" ></a>
    //1,不能保留链接的文字(反向引用)
    //2,不能跨行(贪婪模式)
    var reg = /<a[\s]+.*<\/a>/g;
    var str = '<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" ></a>';
    console.log( str.replace(reg,'<a href="#" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >文字</a>') ); 
    

    js不支持单行模式。

    //s 单行模式:把整个字符串看成一行
    
    . 代表任意,但不包括换行。
    
    
    

    在js里,不支持当行模式的情况下,如何换行?

    什么样的模式能代表“所有” 字符串
    sS 全部字符 使用一个技巧, 一个集合加补集,就是全集
    [dD] [sS] [wW]

    var reg = /\<a[\s][\s\S]+<\/a>/g;
    var str = '<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >'+ 
     '</a>';
    console.log( str.replace(reg,'<a href="#" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >文字</a>') );
    
    //s 多行模式:碰到一行就把当前的当成一个字符串来解析
    
    //把每一行的结尾的数字换成 #
    //车牌号
    //Cx003
    //A0008
    //B3456
    var str = 'Cx003'+
    'A0008'+
    'B3456';
    var reg = /\d+$/gm;
    console.log( str.replace(reg,'#') );
    

    贪婪模式

    贪婪模式

    如果'"htmlcode">

    //goooooooooods --> goods
    var str = 'goooooooooods,goooods,goooood,gooooo,gooooods';
    var reg = /g[o]{3,}"htmlcode">
    
    //查找进行时的单词的词根, 即 不要ing 。 going -> go
    var str = 'going,comming,fly';
    // var reg = /\b[a-zA-Z]+ing\b/g;
    var reg = /\b[\w]+("" src="/UploadFiles/2021-04-02/2020513100246786.png">

    JavaScript 正则应用详解【模式、欲查、反向引用等】

    JavaScript 正则应用详解【模式、欲查、反向引用等】

    满足 ing ,找到com。

    JavaScript 正则应用详解【模式、欲查、反向引用等】

    不满足接着走。 看见不满足条件,并不会一次性调到ing后面接下去寻找,而是从该处光标继续寻找。
    已经查找的词是消耗了,下次从该处光标开始寻找。

    JavaScript 正则应用详解【模式、欲查、反向引用等】

    //查找进行时的单词的词根, 即 不要ing 。 going -> go
    var str = 'going,comming,fly';
    // var reg = /\b[a-zA-Z]+ing\b/g;
    // var reg = /\b[a-zA-Z]+("go", "comm"] 
    
     

    负向欲查

    不是谁才行。 往后看一定位数,不是谁才可以。 不要后面是某某某的东西。

    JavaScript 正则应用详解【模式、欲查、反向引用等】

    //查找win98,win95,win32,win2003,winxp -->win98,win32,win2003,winxp
    var str = 'win98,win95,win32,win2003,winxp';
    var reg = /\bwin("win", "win", "win", "win"]
    
    

    js不支持,向前正向欲查,向前负向欲查:

    //找出 un系列单词的词根
    var reg = /[\w]+("htmlcode">
    
    //把链接换成空连接,保持文字信息。
     var str = '<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >阴天快乐</a>';
     var reg = /<a[\s]+[^>]+>([^<>]+)<\/a>/; //超链接的表达式
     console.log( reg.exec(str) ); //["<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >阴天快乐</a>", "阴天快乐", index: 0
    , input: "<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >阴天快乐</a>"] //能够把子表达式的东西匹配出来。
     // console.log( str.replacte(reg,'#') );
     /**
      <a[\s]+[^>]>([^<>]+)<\/a> 主要目的是想要中间那一块
      除了>之外的都可行 , 取> 的补集 [^>]
      中间部分纯文字,不含大于号,和小于号。 取小于号和大于号的补集 [^<>]+ / [\s\S]+
     */
     //一般是整个表达式, 但是中间的部分 有特殊做了描述。 需要的部分特殊处理。使用分组,叫做子表达式。
     //匹配html
     // /<\s*(\S+)(\s[^>]*)"整个正则表达式的匹配结果"
      1,2,3,4....N,则代表第N个子表达式匹配的结果。 //js顶多有9个子表达式。 // ["<a href="http://www.baidu
    .com">阴天快乐</a>", "阴天快乐", index: 0, input: "<a href="http://www.baidu.com" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >阴天快乐</a>"]
     */
     console.log( str.replace(reg,'<a href="#" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >$1</a>') ); //<a href="#" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >阴天快乐</a>
     
     var str = '<html></html>';
     var reg = /<\s*(\S+)(\s[^>]*)"_blank" href="//www.jb51.net/Special/909.htm">JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结》

    希望本文所述对大家JavaScript程序设计有所帮助。