Topic: A lexical view of contrast pairs in preference datasets