読者です 読者をやめる 読者になる 読者になる

よしだのブログ

サブタイトルはありません。

Solr 4.10 のリリースハイライト

リリースから1ヶ月近く立ってしまいましたが、9月3日にSolr 4.10 がリリースされました。というわけで、リリースハイライトを整理してみました。

http://lucene.apache.org/solr/solrnews.html#03-september-2014-apache-solr-4100-available

Solr Cell で使用している Apache POI のバージョンアップ (脆弱性対応)

http://lucene.apache.org/solr/solrnews.html#18-august-2014-recommendation-to-update-apache-poi-in-apache-solr-480-481-and-490-installations

Solr example 用に、起動・停止スクリプトの追加

  • bin/solr というコマンドが追加されています。
  • 単体の Solr の起動のほか、一切の設定が不要でSolrCloud、DIH、マルチコア、スキーマレスモードの起動が可能です。
  • ちなみに SolrCloud を起動する際には、内部の zookeeper を起動してくれるので、別途用意する必要が無いです。

https://cwiki.apache.org/confluence/display/solr/Getting+Started+with+SolrCloud

分散環境における、facet.pivot をサポート。

  • facet.pivot は複数階層を掛けあわせた集計を行うファセットです。(超便利!)
  • 分散環境下では利用できなかったのが、今回のアップデートで利用できるようになりました。

https://gist.github.com/kuwabarahiroshi/4266118

Interval Faceting 機能の追加

  • 例えば、0円から100円、100円から1000円・・、というように一定の間隔を持ったファセットを作るケースがあります。
  • 従来は、facet query という機能を使い、バケットごとにレンジクエリを用意して実現していました。
  • これが、Interval Faceting という機能で、以下のように簡略化して記載することができるようになりました。
  • さらに、バケットごとに表示用のラベルまで指定することができます。これも従来はクエリがそのままバケットのラベルとして表示されていました。
  • また、JIRA のチケットへの投稿によるとパフォーマンスも facet.query よりも速いそうです。

Interval Faceting

&f.price.facet.interval.set=[0,10]&f.price.facet.interval.set=(10,100]

Interval Faceting (ラベルを指定する場合)

&f.price.facet.interval.set={!key=foo}[0,10]&f.price.facet.interval.set={!key=bar}[10,100]

facet query を使った場合の書き方

&facet.query=price:[0 TO 10]&facet.query=price:[10 TO 100]

https://wiki.apache.org/solr/SimpleFacetParameters#Interval_Faceting

terms QParser の追加

  • Lucene で追加された TermsFilter を Solr から利用するためのアップデート。
  • 指定した複数のタームのいずれかに一致する文書を探す場合に使います。
  • 従来の書き方に比べ、シンプルになったのと、高速になっているそうです。

terms QParser

fq={!terms f=tags}software,apache,solr,lucene

従来の書き方

fq={!df=tags q.op=OR}software apache solr lucene

https://cwiki.apache.org/confluence/display/solr/Other+Parsers#OtherParsers-TermsQueryParser

ご参考まで。

参考書籍

[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)

[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)

  • 作者: 大谷純,阿部慎一朗,大須賀稔,北野太郎,鈴木教嗣,平賀一昭,株式会社リクルートテクノロジーズ,株式会社ロンウイット
  • 出版社/メーカー: 技術評論社
  • 発売日: 2013/11/29
  • メディア: 大型本
  • この商品を含むブログ (6件) を見る