]> cat aescling's git repositories - mastodon.git/commit
Use Status.group instead of Status.distinct in HashQueryService (#14662)
authorAkihiko Odaki <nekomanma@pixiv.co.jp>
Tue, 25 Aug 2020 11:39:35 +0000 (20:39 +0900)
committerGitHub <noreply@github.com>
Tue, 25 Aug 2020 11:39:35 +0000 (13:39 +0200)
commit41eeb9ebaa65abe3fcbab60847b69d2469726d8a
treef4ea8b1eee79722b5f0eb12f0b4067a58288c99f
parent9cadd40cf4e52a299ba828e84b6a4fddaf976afb
Use Status.group instead of Status.distinct in HashQueryService (#14662)

DISTINCT clause removes duplicated records according to all the selected
attributes. In reality, it can remove duplicated records only looking at
statuses.id, but the clause confuses the query planner and yields
insufficient performance.
The behavior is also problematic if the scope produced by HashQueryService
is used to query columns without id (using pluck method, for example). The
scope is expected to contain unique statuses, but the uniquness will be
evaluated with some arbitrary columns other than id.

GROUP BY clause resolves those problem by explicitly specifying the
column to take into account for the record distinction.

A workaround for the problem of DISTINCT clause in
Api::V1::Timelines::TagController is no longer necessary and removed.
app/controllers/api/v1/timelines/tag_controller.rb
app/services/hashtag_query_service.rb