Review Papers (Misc) - Kazuhiro Seki
-
テキストデータを利用した新しい景況感指標の開発と応用 (下) ―応用編:深層学習を利用したテキスト分析―
生田 祐介, 関 和広, 松林 洋一
APIR Discussion Paper Series 48 2021.2
Publishing type:Internal/External technical report, pre-print, etc.
-
Toward Exploratory Search in Biomedicine: Evaluating Document Clusters by MeSH as a Semantic Anchor.
Michael Segundo Ortiz,Kazuhiro Seki,Javed Mostafa
CoRR abs/1812.02129 2018
-
Measures of Cluster Informativeness for Medical Evidence Aggregation and Dissemination.
Michael Segundo Ortiz,Sam Bubnovich,Mengqian Wang,Kazuhiro Seki,Javed Mostafa
CoRR abs/1809.01678 2018
-
金融情報学: ファイナンスにおける人工知能応用
関和広, 水田孝信, 八木勲, 落合友四郎, 酒井浩之, 和泉潔
人工知能学会誌 32 ( 6 ) 905 - 910 2017
Authorship:Lead author Publishing type:Article, review, commentary, editorial, etc. (international conference proceedings) Publisher:人工知能学会
-
Semantic Web Today: From Oil Rigs to Panama Papers.
Rivindu Perera,Parma Nand,Boris Bacic,Wen-Hsin Yang,Kazuhiro Seki,Radek Burget
CoRR abs/1711.01518 2017
-
吉原 輝, 関 和広, 上原 邦昭
研究報告数理モデル化と問題解決(MPS) 2015 ( 4 ) 1 - 6 2015.2
Publisher:一般社団法人情報処理学会
投資家が投資を行う際,株価等の数値情報の他に,新聞記事等の言語情報を基に株の売買を判断する.この判断を支援するため,これまで様々な研究が行われており,数値情報を対象にした研究では,株価の時系列データの特性が多く利用されている.これに対し,言語情報を対象にした研究では,その特性がほとんど利用されていない.これは,言語情報が株価に与える影響の時間的な変化を人手でルール化することが困難だからである.一方で,画像認識や音声認識などの分野において近年注目を集めている深層学習 (Deep Learning) は,大規模なデータから有益な特徴の抽出が可能である.そこで本研究では,深層学習のアプローチを応用し,時間的な変化を考慮した再帰的なネットワークを構築することで株価動向の推定を行う手法を提案する.入力に新聞記事のデータを用いることで,言語情報が与える影響の時間的な変化を捉えることができる.実際の新聞記事と株価のデータを用いて 10 銘柄の株価動向推定を行い,本手法の有効性を示す.
-
Financial Trend Prediction and Analysis through Textual Data
藤川 和樹, 関 和広, 上原 邦昭
人工知能学会全国大会論文集 28 1 - 4 2014
Publisher:人工知能学会
-
Shun Kawahara,Kuniaki Uehara,Kazuhiro Seki
Proceedings of The Twenty-Third Text REtrieval Conference, TREC 2014, Gaithersburg, Maryland, USA, November 19-21, 2014 2014
Publisher:National Institute of Standards and Technology (NIST)
Other Link: http://dblp.uni-trier.de/db/conf/trec/trec2014.html#conf/trec/KawaharaUS14
-
一般講演 マイクロブログ文書の選択による擬似適合フィードバック (データ工学)
宮西 大樹, 関 和広, 上原 邦昭
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 ( 150 ) 83 - 88 2013.7
Publisher:一般社団法人電子情報通信学会
マイクロブログ検索では擬似適合フィードバックを用いたクエリ拡張が有効であることが知られている.擬似適合フィードバックでは,初期検索の上位の検索結果は適合文書であり,この適合文書の中にユーザクエリの補強に役立つ単語が含まれていると仮定している.しかし,上位の検索結果の多くが非適合文書である場合,擬似適合フィードバックを用いると,ユーザクエリに関係のない単語を選んでしまう可能性がある.そこで,提案手法は上位の検索結果の中からマイクロブログ文書を1つだけユーザが選び,この文書をクエリ拡張に用いることで選んだ適合文書と類似した適合文書を上位の検索結果に集める.そして,再検索した上位の結果に対して擬似適合フィードバックを適用することで,検索精度の向上を図る.マイクロブログの代表的なサービスであるTwitterのデータを用いて提案手法と従来の擬似適合フィードバックとを比較する.
-
宮西 大樹, 関 和広, 上原 邦昭
情報処理学会研究報告. 情報学基礎研究会報告 2013 ( 15 ) 1 - 6 2013.7
Publisher:一般社団法人情報処理学会
マイクロブログ検索では擬似適合フィードバックを用いたクエリ拡張が有効であることが知られている.擬似適合フィードバックでは,初期検索の上位の検索結果は適合文書であり,この適合文書の中にユーザクエリの補強に役立つ単語が含まれていると仮定している.しかし,上位の検索結果の多くが非適合文書である場合,擬似適合フィードバックを用いると,ユーザクエリに関係のない単語を選んでしまう可能性がある.そこで,提案手法は上位の検索結果の中からマイクロブログ文書を 1 つだけユーザが選び,この文書をクエリ拡張に用いることで選んだ適合文書と類似した適合文書を上位の検索結果に集める.そして,再検索した上位の結果に対して擬似適合フィードバックを適用することで,検索精度の向上を図る.マイクロブログの代表的なサービスである Twitter のデータを用いて提案手法と従来の擬似適合フィードバックとを比較する.
-
On-demand epidemic surveillance using social sensors
岡村 直人, 関 和広, 上原 邦昭
神戸大学都市安全研究センター研究報告 ( 17 ) 177 - 184 2013.3
Publisher:神戸大学都市安全研究センター
-
Hierarchical phrase clustering based on different types of predicate argument relations
KUMANAMI Koji, SEKI Kazuhiro, UEHARA Kuniaki
Technical report of IEICE. Thought and language 112 ( 442 ) 49 - 54 2013.2
Publisher:The Institute of Electronics, Information and Communication Engineers
This paper proposes an approach to clustering synonymous phrases focusing on two types of predicate argument relations extracted from natural language texts One is associated with similar causes, the other with similar effects Based on the context represented by those relations, a matrix is constructed with rows being noun phrases and columns being a pair of a noun and a verb phrases Due to the inherent sparsity of the matrix, two strategies are taken to group nouns with similar distributions One strategy is to simply use a large-scale cor-pus, which however results in a huge matrix To handle the matrix, a parallel distributed programming model, MapReduce, is employed The other is to adapt hierarchical clustering using co-clustering The effectiveness of the proposed approach is empirically demonstrated on a series of experiments.
-
Learning Non-Linear Classifiers with a Sparsity Upper-Bound via Efficient Model Selection
BLONDEL Mathieu, SEKI Kazuhiro, UEHARA Kuniaki
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning 112 ( 83 ) 9 - 14 2012.6
Publisher:The Institute of Electronics, Information and Communication Engineers
Support Vector Machines, when combined with kernels, achieve state-of-the-art accuracy on many datasets. However, their use in many real-world applications is hindered by the fact that their model size is often too large and their prediction function too expensive to evaluate. In this paper, to address these issues, we are interested in the problem of learning non-linear classifiers with a sparsity budget. We first define an L1-regularized convex objective and show how to optimize it, without budget. Next, we show how our approach can be naturally extended to incorporate a budget by using constrained model selection. Experiments show that, compared to SVMs, our approach leads to much more parsimonious models with comparable or better accuracy.
-
東山翔平, 関和広, MathieuBlondel, 上原邦昭
第74回全国大会講演論文集 2012 ( 1 ) 653 - 654 2012.3
固有表現抽出は,自然言語処理における基本的な問題のひとつであり,テキスト中に現れる固有名詞や時間表現などを同定することを目的とする.抽出の対象となる固有表現は,組織名や人名などが一般的であり,これらのカテゴリは本来,階層性を有する.たとえば,組織名はさらに会社名や大学名などのカテゴリに細分化されうる.このような階層構造のカテゴリを考えたとき,階層的に近い(遠い)という情報は固有表現抽出の際に利用可能であり,カテゴリ数が多い場合に特に有用であると考えられる.本研究では,構造化パーセプトロンによるカテゴリの階層性を考慮した固有表現抽出法を提案し,その有効性を検証する.
-
D-20-6 BLOG DISTILLATION WITH DATA FUSION
Nakasuga Akihiro, Seki Kazuhiro, Uehara Kuniaki
Proceedings of the IEICE General Conference 2012 ( 2 ) 2012.3
Publisher:The Institute of Electronics, Information and Communication Engineers
-
D-5-5 Learning to rank for real-time microblog retrieval
Liu Xiaoxi, Seki Kazuhiro, Uehara Kuniaki
Proceedings of the IEICE General Conference 2012 ( 1 ) 2012.3
Publisher:The Institute of Electronics, Information and Communication Engineers
-
熊南昂司, 関和広, 上原邦昭
第74回全国大会講演論文集 2012 ( 1 ) 643 - 644 2012.3
言語表現の多様性から,二つの語間の表層的な不一致は必ずしも意味的な不一致を意味しない.たとえば,carとautomobileは表層的には異なるものの,いずれも自動車を意味する.複数の語からなる句(フレーズ)の場合,表層と意味の不一致はさらに増加する.表層的に異なるフレーズ間の意味的な一致を判定することは,談話理解・生成においてきわめて重要である.本研究では,大規模なコーパスから抽出した大量のフレーズとその周辺文脈を基に階層的なクラスタリングを行うことで,意味的に類似したフレーズを同定する.また,大規模データに対応するため,MapReduceプログラミングモデルに適した効率的なクラスタリングアルゴリズムを提案する.
-
Stock Price Prediction by Combining Stock Price Regression and Web News Text Mining
TAKAHASHI Hiroyoshi, SEKI Kazuhiro, UEHARA Kuniaki
Technical report of IEICE. PRMU 111 ( 430 ) 103 - 108 2012.2
Publisher:The Institute of Electronics, Information and Communication Engineers
In this study, we propose a method for stock price prediction using web news articles. There are two types of information available to predict stock prices : numeric information such as stock prices, and textual information such as news articles. Prediction using only numeric information is insufficient because company's news also has some influence on their stock price. We apply a regression analysis for predicting using features extracted from news articles. Evaluative experiments using web news articles as textual information examine whether stock price can be predicted more accurately.
-
Learning Robust Sparse Kernel Classifiers
ブロンデルマチュー, 関 和広, 上原 邦昭
研究報告数理モデル化と問題解決(MPS) 2011 ( 2 ) 1 - 8 2011.11
カーネル分類器は多くのデータセットに対して優れた精度を示すことが分かっている.しかし,カーネル分類器のモデルの複雑性は訓練事例数に応じて線形に増加するため,訓練データの規模が大きくなるほど効果的にカーネル分類器を学習することが難しくなる.本研究では,スパースカーネル分類器を学習するための新しい逐次最適化アルゴリズムを提案する.提案アルゴリズムは,カーネルパーセプトロンと kernel matching pursuit に着想を得たものであり,a) 訓練データを有効に使用できる,b) ラベルノイズに頑健である,c) 任意の損失関数を利用できる,d) 実装も容易であるという多くの特長がある.複数のデータセットで評価実験を行ったところ,多くの実験設定において,提案手法は従来手法と同等か高い精度を示すことが明らかになった.Despite state-of-the-art accuracy on many real-world datasets, kernel classifiers remain notoriously difficult to train efficiently because the model complexity has a linear dependency with the number of training instances. In this paper, we propose a novel incremental optimization algorithm for learning sparse kernel classifiers in the primal. Strongly influenced by the kernel perceptron and kernel matching pursuit, our algorithm makes efficient use of training data, is robust to label noise, can employ any convex subdifferentiable loss function and is simple to implement. Extensive experiments on several standard datasets show that our algorithm achieves comparable or better performance than several existing methods.