写一个简单高效的 JSON 查询器

作者：互联网出处：控件中国网 2014-11-05 19:06:00 阅读：1

JSON可谓是JavaScript的亮点，它能用优雅简练的代码实现Object和Array的初始化。同样是基于文本的数据定义，它比符号分隔更有语义，比XML更简洁。因此越来越多的JS开发中，使

用它作为数据的传输和储存。

　　JS数组内置了不少有用的方法，方便我们对数据的查询和筛选。例如我们有一堆数据：

var heros = [

// 名============攻=====防=======力量====敏捷=====智力====

{name:'冰室女巫', DP:38, AP:1.3, Str:16, Dex:16, Int:21},

{name:'沉默术士', DP:39, AP:1.1, Str:17, Dex:16, Int:21},

{name:'娜迦海妖', DP:51, AP:6.0, Str:21, Dex:21, Int:18},

{name:'赏金猎人', DP:39, AP:4.0, Str:17, Dex:21, Int:16},

{name:'剧毒术士', DP:45, AP:3.1, Str:18, Dex:22, Int:15},

{name:'光之守卫', DP:38, AP:1.1, Str:16, Dex:15, Int:22},

{name:'炼金术士', DP:49, AP:0.6, Str:25, Dex:11, Int:25}

//...

];

　　要查询攻击大于40并且防御小于4的英雄，我们可以用Array的filter方法：

var match = heros.filter(function(e) {

return e.DP > 40 && e.AP < 4;

});

　　返回得到一个数组，包括符合条件的2个结果。

　　相比手工去写循环判断，filter方法为我们提供了很大的方便。但它是基于函数回调的，所以每次使用必须写一个function，对于简单的查询很是累赘，而且使用回调效率也大大降低。

但这是也没有办法的，想简单必然要牺牲一定性能。如果能使用比这更简单的语句，并且完全拥有代码展开时效率，该有是多么完美的事。

　　先来想象下，要是能将上面的代码写成这样（Demo在文章最后）：

var match = heros.select('@DP>40 AND @AP<4');

　　看上去有点像SQL，连语法都换了？这样岂不是要写一个词法分析，语义解释等等等等一大堆的脚本引擎的功能了，没个几千上万行代码都搞不定，而且效率肯定更糟了。。。如果想到

那么复杂，那么你还没深刻的理解脚本的精髓。但凡是脚本语言，都有运行时动态解释代码的接口，例如vbs的execute()；js的eval()，new Function()，甚至创建一个<script>动态写入

代码。

　　显然，要是能将另一种语言，翻译成js代码，那么就可直接交给宿主来执行了！

　　例如上面select中的字符，我们简单的将"@"替换成"e.", "AND"替换成"&&"，于是就成了一个合法的js表达式，完全可以交给eval来执行。

　　所以我们要做的，就是将原始语句翻译成js语句来执行。并且为了提高效率，将翻译好的js表达式内联到一个上下文环境，生成一个可执行的函数体，而不是每次遍历中都依靠回调来判

断。

　　于是，函数模版就要派上用场了。

函数模版简介

　　在C++里面，有宏和类模版这么个东西，可以让一些计算在编译阶段就完成了，大幅提升了运行时代码的性能。脚本虽然没有严格意义上的编译，但在第一次执行的时候会解析并充分

的优化，这是目前主流浏览器相互竞争点。所以，我们要将重复eval的代码，镶嵌到事先提供的样板函数里：一个准备就绪，就差表达式计算的函数。

/**

* 模版: tmplCount

* 功能: 统计arr数组中符合$express表达式的数量

function tmplCount(arr) {

var count = 0;

for(var i = 0; i < arr.length; i++) {

var e = arr[i];

if($express) {

count++;

}

return count;

}

　　上面就是一个模板函数，用来统计参数arr[]中符合$express条件的数量。除了if(...)内的表达式外，其他都已经准备就绪了。字符"$express"也可以换成其他标识，只要不和函数内其

他字符冲突即可。

　　当我们需要实例化时，首先通过tmplCount.toString()将函数转成字符串格式，然后将其中的"$express"替换成我们想要的表达式，最后eval这串字符，得到一个Function类型的变

量，一个模板函数的实例就产生了！

　　我们简单的演示下：

/**

* 函数: createInstance

* 参数: exp

* 一段js表达式字符串，用来替换tmplCount模板的$express

* 返回：

* 返回一个Function，模版tmplCount的实例

function createInstance(exp)

{

// 替换模板内的表达式

var code = tmplCount.toString()

.replace('$express', exp);

// 防止匿名函数直接eval报错

var fn = eval('0,' + code);

// 返回模板实例

return fn;

}

// 测试参数

var student = [

{name: 'Jane', age: 14},

{name: 'Jack', age: 20},

{name: 'Adam', age: 18}

];

// demo1

var f1 = createInstance('e.age<16');

alert(f1(student)); //1个

// demo2

var f2 = createInstance('e.name!="Jack" && e.age>=14');

alert(f2(student)); //2个

　　注意createInstance()的参数中，有个叫e的对象，它是在tmplCount模版中定义的，指代遍历时的具体元素。返回的f1，f2就是tmplCount模板的两个实例。最终调用的f1，f2函数

中，已经内嵌了我们的表达式语句，就像我们事先写了两个同样功能的函数一样。由于判断的表达式已经完全融合在函数内了，所以不用在遍历的时候回调，效率大幅提升。

　　其实说白了，tmplCount的存在仅仅是为了提供这个函数的字符串而已，其本身从来不会被调用。事实上用字符串的形式定义也一样，只不过用函数书写比较直观，方便测试。

　　值得注意的是，如果脚本后期需要压缩优化，那么tmplCount模板绝对不能参与，否则对应的"e."和"$express"都有可能发生变化。

JSON基本查询功能

　　函数模板的用处和实现介绍完了，再来回头看之前的JSON查询语言。我们只需将类似sql的语句，翻译成js表达式，并且生成一个函数模板实例。对于相同的语句，我们可以进行缓存，

避免每次都翻译。

　　首先我们实现查询器的模板：

var __proto = Object.prototype;

// 模板: __tmpl

// 参数: $C

// 说明: 记录并返回_list对象中匹配$C的元素集合

var __tmpl = function(_list) {

var _ret = [];

var _i = -1;

for(var _k in _list) {

var _e = _list[_k];

if(_e != __proto[_k]) {

if($C)

_ret[++_i] = _e;

}

return _ret;

}.toString();

　　然后开始写Object的select方法：

// select方法实现

var __cache = {};

__proto.select = function(exp) {

if(!exp)

return [];

var fn = __cache[exp];

try {

if(!fn) {

var code = __interpret(exp); //解释表达式

code = __tmpl.replace('$C', code); //应用到模版

fn = __cache[exp] = __compile(code); //实例化函数

}

return fn(this); //查询当前对象

}

catch(e) {

return [];

}

　　其中__cache表实现了查询语句的缓存。对于重复的查询，性能可以极大的提升。

function __compile() {

return eval('0,' + arguments[0]);

}

　　__compile之所以单独写在一个空函数里，就是为了eval的时候有个尽可能干净的上下文环境。

　　__interpret是整个系统的重中之重，负责将查询语句翻译成js语句。它的实现见智见仁，但尽可能简单，不要过度分析语法。

　　具体代码查看： http://files.cnblogs.com/index-html/jsonselect.js

　　出于演示，目前只实现部分基本功能。以后还可以加上 LIKE，BETWEEN，ORDER BY 等等常用的功能。

　　Demo

var heros = [

// 名============攻=====防=======力量====敏捷=====智力====

{name:'冰室女巫', DP:38, AP:1.3, Str:16, Dex:16, Int:21},

{name:'沉默术士', DP:39, AP:1.1, Str:17, Dex:16, Int:21},

{name:'娜迦海妖', DP:51, AP:6.0, Str:21, Dex:21, Int:18},

{name:'赏金猎人', DP:39, AP:4.0, Str:17, Dex:21, Int:16},

{name:'剧毒术士', DP:45, AP:3.1, Str:18, Dex:22, Int:15},

{name:'光之守卫', DP:38, AP:1.1, Str:16, Dex:15, Int:22},

{name:'炼金术士', DP:49, AP:0.6, Str:25, Dex:11, Int:25}

//...

];

　　测试：heros.select(' ')查询

// 查询：力量，敏捷都超过20的

// 结果：娜迦海妖

var match = heros.select('@Str>20 AND @Dex>20');

// 查询：“士”结尾的

// 结果：沉默术士,剧毒术士,炼金术士

var match = heros.select('right(@name,1)="士" ');

// 查询：生命值超过500的

// 结果：炼金术士

var match = heros.select('100 + @Str*19 > 500');

功能分类